Help Conquer Cancer

来自中国分布式计算总站
Help Conquer Cancer
Help Conquer Cancer logo
Help Conquer Cancer logo
Help Conquer Cancer 屏幕保护图形
Help Conquer Cancer 屏幕保护图形
World Community Grid 的子项目
开发者 加拿大多伦多大学安大略癌症研究所 Canada.gif
版本历史 2007年11月6日
计算程序 WindowsLinuxMac OS XNVIDIA
项目类别 生命科学
项目状态 运行中/开放注册
官方网址 Help Conquer Cancer

Help Conquer Cancer(意为“征服癌症”),是 IBM 公司主持的 World Community Grid 项目的子项目。

项目概述

项目状态和成果

“征服癌症”Web 站点的页面中提供了有关该项目的信息,另外,项目科学家也在该站点中提供了信息。要获取最新的状态报告,请参阅“征服癌症”状态报告。如果对该项目有意见或疑问,请在“征服癌症”论坛上发布贴子。

任务

“征服癌症”项目的任务是改进蛋白质 X 射线结晶学的结果,这不仅能够帮助研究人员解释人类蛋白质组的未知部分,更重要的是还能够提高他们对癌症的产生、发展及治疗的理解。

意义

为了提高对癌症及其治疗方法的理解,研究人员不仅需要发现针对转移性癌症(即可以扩散到人体其他部位的癌症)的新型疗法,而且必须确定能够探测出早期癌变的诊断标记物(也叫疾病指标)。

研究人员在有关蛋白质的信息有限或根本没有此类信息的情况下,也已在多种人类癌症的研究方面中取得了多项重大发现。然而,为了更好地理解和治疗癌症,科学家们发现与癌症相关的新蛋白质及其结构和功能就显得十分重要。

科学家们对可能与癌症有功能关系的蛋白质特别感兴趣。这包括在肿瘤中增生或抑制的蛋白质,以及那些发生改变或变异从而导致结构性变化的蛋白质。

通过改进 X 射线结晶学,将使研究人员能够更快地确定多种与癌症相关的蛋白质的结构。这将提高我们对这些蛋白质功能的理解,并能帮助我们发现可能的药物介入方法,以便攻克这种致命的疾病。

项目详细信息

X 射线结晶学

Hcc1 inset xtal.jpg

X 射线结晶学 (X-ray crystallography) 是一种广受欢迎的蛋白质结构确定方法。通过这种方法,科学家们能够使用高通量的结晶管道来帮助说明人类蛋白质组的未知部分,从而又能帮助理解癌症的产生、发展及治疗。*

X 射线结晶学包括两个主要步骤:

  1. 使蛋白质结晶:这就好比把糖放入一杯水中并保持一段时间。当水蒸发之后,微小的糖晶体就会显现出来。当然,蛋白质结晶的过程要比这复杂得多。
  2. 使 X 射线穿过晶体:科学家们使用一种数学模型,根据蛋白质衍射 X 射线的方式来确定和观察它们的结构。

使蛋白质结晶并不是一个简单的过程。存在数千种可能会影响结晶过程的条件,比如蛋白质的浓度、溶解度、温度、酸碱度、化学添加剂等,但科学家们必须找到适合某种蛋白质结晶的条件组合。以糖为例,如果将水换成其他液体,改变温度或浓度,就可能无法得到晶体。与此类似,对于特定的蛋白质而言,难题在于如何确定能够形成晶体的条件,如溶解度、温度、酸碱度,等等。

Hcc inset circle2.jpg

为了能用 X 射线以高分辨率探测蛋白质的结构,所形成的蛋白质晶体还必须结构良好且足够大。如果蛋白质结晶的条件不理想,就有可能产生微晶体,从而会因晶体过小而无法确定蛋白质的结构;或是产生沉淀物,能够显示某些变化,但却无法直接完成结晶过程;或者,根本不会发生任何变化。

令人沮丧的是,通常对于癌症研究越重要的蛋白质就越难以结晶化,这是横亘在我们前进道路上的另一个障碍。许多与癌症有关的蛋白质都是长链,或者它们需要其他的蛋白质才能正确地进行折叠,因此无法使它们自身进行结晶。

Hcc1 inset xtal2.jpg

为了运行成功地使蛋白质结晶所需的数百万次条件组合,科学家使用机器人来完成这项工作。机器人能够更快更准确的组合各种不同的结晶条件。为了更加促进这一过程,这数百万次结晶实验的所有结果都拍摄成了照片。

现在,位于布法罗市 Hauptman-Woodward Medical Research Institute (HWI) 的科学家们已经对 9400 多种蛋白质进行了超过 8600 万次的结晶实验。作为结果,他们获得了超过 8600 万张通过 X 射线结晶学高通量拍摄管道的蛋白质的照片。每张照片都需要进行分析,以确定实验的结果是晶体、沉淀物、相位分离、表面效应还是无变化。

Hcc1 inset outcomes.jpg

这些研究人员所遇到的难题之一是这些数据集的规模实在太大,存储容量总计超过了 25 TB(相当于 9000 多张 DVD)。IBM 的“蓝色基因”(Blue Gene) 超级计算机为这阶段的工作提供了帮助,它通过一种特殊的图像压缩算法对这些图像进行无损压缩。研究人员还面临另一个挑战,即在一台计算机上全面分析一张图像以确定结晶化结果大约需要 10 个小时。按照这种进度,研究人员几乎需要 10 万年才能分析完现有的这些照片。

World Community Grid 与“征服癌症”项目

Hcc inset reader1.jpg

借助 World Community Grid 强大的计算能力,Ontario Cancer Institute (OCI)、Princess Margaret Hospital 以及 University Health Network 的科学家们能够对通过 HWI 高通量结晶化管道拍摄的 8600 万幅现有的蛋白质图像进行处理。World Community Grid 运行 OCI 的研究人员开发的 CrystalVision 程序,分析每幅图像的特征,以确定结晶化拍摄的结果:晶体、微晶体、相位分离、表面效应、沉淀物还是无变化。

如果是晶体,检晶仪就对该蛋白质执行最优化过程,以确定该结晶的最优化条件,进而执行衍射实验以确定蛋白质的结构。此外,科学家还可以根据结晶拍摄的结果,将已成功结晶的蛋白质与具有相似特性但结构未知的蛋白质进行对比。这可以作为对这些未知结构的蛋白质进行结晶的出发点,进而能够确定它们的结构。

Hcc inset reader2.jpg

如果产生的晶体结构不佳或不够大,科学家们仍可利用这些信息来帮助他们更好地确定产生结构良好的晶体所必需的条件。举例来说,他们可能了解到蛋白质 X 在条件 A 下产生了微晶体,而蛋白质 A 在条件 Z 下也产生了微晶体。基于这些信息,他们能够进行其他实验来推断出需要最优化哪些条件才能产生更大、结构更好的晶体。

分析这个实验的结果还能够帮助研究人员更好地理解蛋白质结晶学的基本原理。利用 World Community Grid,全面的结晶学图像分析首次得以完成,而由于其计算的复杂性,这在以前是不可能完成的任务。这个实验又使 CrystalVision 得到改进,从而能够提供更快更准确的图像分类。

蛋白质结晶学管道的改进使研究人员能够更快地确定多种与癌症相关的蛋白质的结构。这将提高我们对这些蛋白质功能的理解,并能帮助我们发现可能的药物介入方法,以便攻克这种致命的疾病。

  • 还存在其他一些用于理解蛋白质的结构和功能的方法,包括同样在 World Community Grid 上运行的“人类蛋白质组折叠”项目所采用的方法。基于这项工作的性质,改进所有研究方法对于完善我们对人类机体和疾病的认识非常重要。


研究参与者

研究人员

  • Igor Jurisica,首席研究员,来自 Ontario Cancer Institute

计算方面的科学家

  • Christian A. Cumbaa,助理研究员,来自 Ontario Cancer Institute

协调人员

  • George DeTitta 博士,Hauptman-Woodward Medical Research Institute 的 CEO 兼“结构生物学”系的系主任
  • Joseph R. Luft,首席研究员,来自 Hauptman-Woodward Medical Research Institute
  • Michael Malkowski,首席研究员,来自 Hauptman-Woodward Medical Research Institute

相关链接