校对完成,顺便把全文整合在一起了,前面没有发帖校对的就直接整合进去了,但毕竟是我个人意见,参与翻译的同志们有空可以看看我的想法是不是有问题,咱们讨论讨论
1、项目官网
关于FightMalaria@Home
FightMalaria@Home 是一个利用捐赠 CPU 时间来进行疟疾蛋白质结合模拟的研究项目。您可以用电脑下载并运行一个免费程序来参与。
抗疟药物分布式大搜索
目标:为抗疟药物寻找全新化合物。 资源:恶性疟原虫基因组的测序工作已经完成,蛋白质组已被标记,除此之外,其蛋白质的表达在不同层面上都已有所认识。许多目标蛋白的晶体结构同样被我们所了解,并且剩下来的都已经用现有的结构模型模拟过。令人兴奋的是,大型研究机构(GSK,Novartis)已经对数百万种复合物进行了测试,并且发现了大约19,000种显示出对恶性疟原虫具有活跃抗性的复合物。【消息来自于MMV http://www.mmv.org/malariabox】。但是他们并不清楚这些复合物会对哪一种目标蛋白质产生抑制作用。如果把这些地方都弄清楚了,那么药物研制工作将取得长足进步。 问题:我们计划将18,924种复合物与5,363种疟原虫蛋白质进行结合测试。其所需的算力是十分巨大的。 解决方案:我们打算汇集世界各地个人电脑所捐献的算力。大多数电脑每天的CPU使用率并不高。所以我们建立了一个BOINC服务器用以将配对任务分发给用户的电脑,而之后其便在后台运行。通过这种方式联合数以千计的电脑,我们就将获得相当于超级计算机的强大算力。如果您想参与进来,那就赶快下载吧。
3、Getting involved 页面
开始吧
我们正在开发一个分布式计算项目,用来将已知的候选化合物与疟疾的蛋白质模型进行结合测试,以此列出一系列新奇的目标化合物用以进一步研究。 项目关注的焦点在于发现新奇的治疗药物。开始时,我们会对所有候选化合物与所有的疟原虫蛋白质模型进行结合测试。这应该会为我们提供一份全新的需要在实验室里做进一步研究与确认的候选靶蛋白【译注1】的名单。一旦这些蛋白被确认,大家的计算资源就可以集中力量去发现高效抑制物和开发新型药物了。为了这关键的确认阶段,我们需要世界各地研究团队的鼎力相助,所以我们的所有数据都会在互联网上免费分享给大家。 为了回答我们的第一个问题,我们将需要进行3亿多次的模拟结合。这显然需要难以置信的惊人计算能力,因此我们需要联合世界上闲置的CPU资源。而BOINC是一个成熟的贡献闲置计算时间的平台(索尼甚至将BOINC作为新VAIO电脑的标准自带程序)。 在我们这个项目之前,已经有人发起过fightHIV@home,Africa@home以及GoFightAgainstMalaria等众多类似的分布式计算项目。现在,破解难题的线索都已俱备,其中包括“公开蛋白质组信息(Integr8【译注2】)”,“候选名单(MMV,ChEMBL【译注3】),X射线晶体结构(PDB【译注4】),使用MODELLER或DISTILL的疟疾蛋白质模型,化合物数据库(ZINC,PubChem),结合程序(AutoDock VINA,eHiTS),以及分布式计算平台(BOINC)。当前的挑战包括如何联合这些资源以及如何让公众参与其中。 所有的数据都将在我们的网站上(并且有望同样地在Tropical Diseases Initiative网站上)免费发布,以鼓励其他的热带疾病研究者去进一步验证我们所得到的“化合物-蛋白质”组合中的相互作用情况,兴许能够确认这些新奇的药物。 非常感谢来自SimBioSys的Aniko Simon,因为他专门对SimBioSys的eHiTS程序进行了针对FightMalaria@Home的优化。 未来用以确认目标蛋白的资金将会来自于像“比尔与梅琳达盖茨基金会”这样的慈善机构。拥有利用闲置计算资源的额外好处就是我们也许能为先前那些特征不明的假想蛋白找到潜在配体【译注5】。
【译注1】靶蛋白即药物作用的目标蛋白。 【译注2】该数据库现已停止更新。 【译注3】ChEMBL是一个由欧洲生物信息研究所(EMBL-EBI)负责维护的开放性数据库,其中包括大量的有生物活性的类药性化合物的结合域、功能域和与ADMET信息有关的内容。该网站于2012年在MMV(疟疾药物开发组织)的赞助下启动了名为“Malaria Data”的数据查询服务,专门提供疟疾相关的数据。关于该数据库的详细信息,请移步维基百科(英文): http://en.wikipedia.org/wiki/ChEMBL
FightMalaria@Home Elevator Pitch 疟疾每年会夺去非洲撒哈拉以南地区五十多万人的宝贵生命。恶性疟原虫已经对所有抗疟药物产生了抗性,多耐药率正在提高。开发新药物以应对未来疾病的挑战是势在必行的。一些制药公司已经测试了数百万种针对疟原虫的复合物,并且已将其结果公之于众了。18,924种已被确认的复合物展现了其作为新型药物的潜力,但是没人知道这些复合物究竟与哪些蛋白质相作用。为了进一步助力药物的开发,我们打算用计算机模拟药物与蛋白质结合过程的方式来尽可能多地鉴定这些目标复合物。 将这18,924种复合物与5,363种蛋白质的结构进行结合模拟是一个极为繁重的任务。因此我们需要那些愿意贡献出他们电脑闲置计算资源的公众志愿者所带来的帮助。我们建立了一个BOINC服务器,用以将繁杂的对接问题分割成细小的独立任务,再将其发送给每一个与我们服务器相连的个人电脑。
For Scientists 对于科学家来说 The ChEMBL NeglectedTropical Disease包含了来自于三个团队的高通量筛选结果,这三个团队分别是St.Jude Children's hospital,GSK以及Novartis。尽管每一种目标蛋白的配体结构都还不清楚,但这18,924种已被确认的蛋白质展现了它们成为新型药物的潜力。如果每一种复合物都能够被鉴定出来,那么药物发展领域将会取得长足进步。 我们打算用疟原虫的蛋白质作为受体来进行虚拟高通量筛选。我们已经准备了4,657种蛋白质结构用以结合模拟,其中包括141种X射线结构模型(其中有49种至少含有一个小型分子配合体),以及743种可靠的同源模型。我们正在用DISTILL同源建模技术将其进一步扩展为5363种蛋白质结构。因为我们打算用两个对接程序(Vina和eHiTS)进行交叉验证,所以大约有3亿多次结合计算将会在ICHEC超级计算集群,PS3集群以及BOINC分布式计算平台上进行。( http://boinc.ucd.ie/fmah/) 通过海量计算交叉验证过的对接结果将在实验室里用recombinant protein and Surface Plasmon Resonance and IsothermalTitration Calorimetry做进一步验证。所有的数据都会在我们的网站上公之于众,并且收录于ChEMBL数据库。 我们相信,针对这些新型目标蛋白质的抑制剂应该能够成为对抗疟疾这一疾病的新利器。
6、The Idea 页面
我们的想法
为了寻找新的目标,将已知的抑制剂结合到疟疾道白结构中去。 目标蛋白质的处理按结构的准确性和可靠性依次进行: 1. X射线晶体结构 2. 热带疾病MODPIPE/MODELLER 同源模型活性部位 3. 热带疾病MODPIPE/MODELLER 同源模型,蛋白质评分 > 1.0 同样的,将被结合到蛋白质结构中的小分子配体的处理过程,按重要性依次进行: 1. MMV(疟疾药物开发基金组织) MalariaBox 最佳候选命中化合物 [200药物 + 200探针] 2. 剩余的 MMV(疟疾药物开发基金组织)/GSK(葛兰素史克)/Novartis(诺华)/St.Judes(圣犹达) 命中化合物列表 3. FDA(美国食品药物管理局) 批准的药物(这些已经在患者身上进行过临床试验,已纳入 NPC 数据库) 4. ChEMBL 生物活性化合物,但不在 lists 1-3 内 5. ZINC 数据库,清洁制剂类,多样性子库 6. 环肽 7. ZINC 数据库,清洁制剂类,全数据库
计划试验列表(我们需要您的帮助!)
Abbreviations缩略语 |
| Xray_lig | All P. fal.proteins that have at least one X-ray crystal structure in RCSB with a co-crystalised ligand (one structure per protein) | | All P. fal. proteins that have at least one X-ray crystal structure in RCSB (one structure per protein) | | All Tropical Diseases Initiative MODPIPE models with active site (one model per protein) | | All Tropical Diseases Initiative MODPIPE models with MPQS score > 1.0 (one model per protein) | | DISTILL models of all remaining proteins in the P. fal. proteome (one model per protein) | | Medicines for Malaria 'Malaria Box' collection | | Medicines for Malaria full collection of hit compounds from GSK, Novartis and St. Judes Children's Hospital screening studies | | NCGC (NIH (National Institutes of Health) Chemical Genomics Center) Pharmaceutical Collection (NPC) of approved drugs (global) | | PubChem/ChEMBL bioassay compounds not part of GSK screen, showing inhibition >90%, in wholeP. fal.assays | | Xray_lig with specific crystallographic waters included | | TDI_site with conformational flexibility (5 conformations each) | | TDI_good with conformational flexibility (3 conformations each) | | ZINC version 12 Clean Drug Like compounds (subset #13) diversity subset (Tanimoto 90%) | | ZINC version 12 Clean Drug Like compounds (subset #13) full collection | | CycloPs head-to-tail cyclical peptides 环肽 |
当实验7完成后,我们将实现我们的首要目标。此后,我们会将目标蛋白结构的柔韧性纳入考虑范围,以改进搜索。最后,我们将借助 BOINC 的基础资源,使用小分子的已知X射线衍射结构库和数据库来搜索特效化合物。
又快又简单的途径: 由于计划所需的计算量实在太大,我们很快发现自己根本没能力将所有结果都完整保留。于是作为替代方案,我们仅为每次的结合模拟保留两小块信息: · 最佳结合姿态能量 · Autodock Vina 种子编号 AutoDock Vina 有一个十分方便的功能,它允许从任一指定的种子开始模拟结合。只要给出上次筛选时用的种子,我们就能重现最终的结合姿态,这样就不必存储海量的数据了。
本项目与其他现存的研究有何区别? 据我们所知,只有 WISDOM 网格计算项目和 GoFightAgainstMalaria BOINC 项目是由 AlexPerryman (Scripps) 主持的,直接目的就是寻找能够有效对抗疟疾的新药物。我们最初曾打算做非常类似的工作,但是在2011年11月16日,AlexPerryman 启动了他在 WCG 上的项目,目的在于寻找能用来对付抗药性疟疾的新的化合物。他正使用的目标的细节,请看这里。他们的项目将有助于识别能有效对抗疟疾的化合物,然后在实验室内合成和测试这些命中化合物。 当 Alex 正在将成千上万种化合物与少数目标蛋白质结合的时候,我们都在问,我们是否能找到一种特殊化合物能够抑制的目标蛋白质。在本质上,这是相同的问题,不过我们的思路恰好相反。 我们从 GSK (Tres Cantos)、Novartis-GNF、St. Jude'sChildren's Research hospital 的大量的化验结果中发现,有 18924 种化合物能够抑制寄生在细胞中的恶性疟原虫。但是我们不知道这些化合物如何对寄生虫产生影响。因此,从本质上说,我们正在做的工作,是重复地问19000多次同样的问题:“我们能否找到被这种化合物抑制的蛋白质?”。 要完成这项工作,我们需要一套完整的基因结构信息……只是目前尚未问世。现在我们有的,是141种很好的X射线衍射晶体结构( PDB)和疟原虫体内4657种蛋白质的模型(其中818种和已知的活性部位相似)[ Nat. Biotech, 2009]。因此我们可以说是已经掌握了疟原虫蛋白质组中87%的蛋白质。此外,我们还将使用其他的建模软件(DISTILL)来探索其余蛋白质的结构。 我们还会使用AutodockVina在我们自己的BOINC分布式计算服务器上模拟一些结合。另外,我们将使用运行在PS3集群上的eHiTS软件来验证Vina筛选的成果。 我们的工作成果将会是一个包含了很可能是命中化合物攻击目标的蛋白质的清单。这些蛋白质中,有些是酶,有些是受体,这之中有些甚至可能同时是几种化合物的作用目标。在经由实验室的确认后,即可利用药物化学技术对相关的化合物进行加工,强化这种化合物对疟原虫体内蛋白质的作用效果。这样,在未来探索与开发新药的路上,这些蛋白质将为科学家提供一个绝佳的目标。
目标蛋白质的处理按结构的准确性和可靠性依次进行:
1. X射线晶体结构
2.热带疾病 MODPIPE/MODELLER 同源模型活性部位
3. 热带疾病 MODPIPE/MODELLER 同源模型,蛋白质评分 > 1.0
4. 所有剩余蛋白质的分馏模型
这些信息都将发布在项目的 Wiki 百科上,现在正在筹备中,如需访问,请联系 Dr. Anthony Chubb。
8、Molecules 页面
分子
虚拟筛选的分子
将被结合到蛋白质结构中的小分子配体的处理过程,按重要性依次进行:
1. MMV(疟疾药物开发基金组织) MalariaBox 最佳候选命中化合物 [200药物 + 200探针
2.剩余的 MMV(疟疾药物开发基金组织)/GSK(葛兰素史克)/Novartis(诺华)/St.Judes(圣犹达) 命中化合物列表
3. FDA(美国食品药物管理局) 批准的药物(这些已经在患者身上进行过临床试验,已纳入 NPC 数据库)
4. ChEMBL 生物活性化合物,但不在 lists 1-3 内
5. ZINC 数据库,清洁制剂类,多样性子库
6.环肽
7. ZINC 数据库,清洁制剂类,全数据库
这些信息都将发布在我们 Wiki 百科上,现在正在筹备中,如需访问,请联系 Dr. Anthony Chubb。
-----
译者注:
ZINC 是一个可以免费使用的用于虚拟筛选的化合物数据库,由美国加州大学药物化学系的 Shoichet 研究小组建立并维护。主页地址:http://zinc.docking.org/ 。
ZINC 数据库其中所收录的化合物来自各大化合物合成公司,因此都是可以商业购买的。数据库既存储了化合物的结构信息,也包含了这些化合物的供应商信息。
由于 ZINC 在收录这些化合物的过程中进行了“类药性”过滤,可以以SMILES、mol2、3D SDF 等多种文件格式免费下载,因此特别适用于以分子结合为主的虚拟筛选策略。
9、Results 页面
结果
结合结果
结果将被整合发布到ChEMBL 数据库网站(https://www.ebi.ac.uk/chembl/)。
10、FAQ 页面
常见问题:
问题:BOINC 上早就有研究疟疾的项目啦!和 FightMalaria@Home 项目有什么区别呢?
回答:Africa@HomeBOINC 项目采用分布式计算来研究流行病的传播模型,了解和预测传染性疾病在人群中的传播。虽然这也是一个非常重要和崇高的任务,但是他们的计算不会提供新的治疗药物。
MalariaControl.net 项目利一个用网络计算建模的应用程序,目的是研究疟原虫的临床流行病学特性及其发展史。因此,他们也不参与药物或者目标蛋白质的发现。
GoFightAgainstMalaria BOINC 项目也使用 AutoDock Vina 模拟结合化合物来寻找对抗疟疾的目标蛋白质。但是,他们的重点是寻找能同疟原虫体内的(目前已知能使其产生抗药性的)突变蛋白结合(从而抑制抗药性的)化合物抑制剂。从本质上讲,他们是在试图反击抗药性。FightMalaria@Home 与他们不同,因为我们正在努力做的是:弄清楚疟疾特效药攻击的究竟是哪里。未来这将有助于针对新的目标蛋白开发新的特效药。我们的 FightMalaria@Home 项目,旨在为最贫困的人口提供最便宜的用药,即从药物发现到生产线式生产中,减少研究过程中产生昂贵的费用。通过将研究“众包”化,我们希望能使得新药物的发现变得难以想象的便宜,这其中少不了诸位志愿者自愿贡献的CPU时间、义务进行的科学验证分析,以及将来我们要做的一些临床工作。具体而言,我们希望确定能被已知的化合物抑制的目标。一旦这些目标得到确定,就可通过药物化学直接提高攻击效果并提供针对新目标的特效药物。由于攻击目标位于新的蛋白质或通道上,疟原虫对此种药物将完全没有抵抗能力。
|