Rosetta@home:David Baker 的欢迎信

来自中国分布式计算总站

David Baker 的欢迎信(英语原文)

欢迎您参加 Rosetta@Home 分布式计算项目!

您的参与将帮助我们解决蛋白质折叠这个分子生物学难题。这需要海量的计算。

尽管蛋白质十分微小,但它们却构成了您的身体。 要了解蛋白质的工作原理就得了解它们的构成。 我们知道,蛋白质的氨基酸排列次序决定了它们的结构。 由于科学家们的探索,我们确定了人类基因的排列次序。 但是,我们几乎不可能从蛋白质的基因排序中准确分析或计算出他们的结构。 这个问题就像是科学界中的“圣杯”。

您或许在最近的科学读物或新闻中已经得知,在最近的6个月里,我们在这个问题上取得了很大的成就。也就是说,我们可能通过蛋白质的排列次序准确地分析出他们的结构。假如我们真的找到了分析的方法,那么这将是人类医学、生物学上的一个伟大成就。更重要的是,人类由此就找到了预防和对付重大疾病的方法! 但是,解决这个问题需要进行长期大量的计算。

让我来解释一下这个项目的大致计算原理。打个比方,假如您被派作宇宙探险者,您需要找到指定星球表面的最低点。那您怎么找呢? 一个可能是降落到那个星球上,然后从降落点开始搜寻。但是您未必能准确找到最接近目标的地方降落。又比如,假如您在地球上降落,很难说您一定就能降落在死海岸附近的地方。您可能在喜马拉雅山脉或撒哈拉沙漠降落。但如果您有 10000 个探测器呢?情况将大为不同。这些探测器随机降落,并且向您汇报他们各自所找到的海拔最低点。那么,您找到真正最低点的可能性将会大大提高。而且,您送出的探测器越多,成功的机率越大。

而我们现在所要寻找的不是太空中行星表面的最低点,而是所有可能构成蛋白质的结构。可能构成蛋白质的结构很多。因为蛋白质可以通过上百种不同的方式发生折叠。但是不管它们怎样折叠,只有当他们的结构符合“被允许的条件”时,才能发挥它们的生物职能。而这些被折叠的蛋白质有一个明显特点,那就是:它们的耗能比其它蛋白质更低。所以我们采取一种更有效的方法,那就是以最低能耗蛋白质作为寻找目标。可惜这种方法所存在的问题与前文所提及的相类似。那就是要搜索的范围太广了。

那您会问,我的电脑接下来会做什么?计算的初始阶段,rosetta 会在一块随机选择的能量带“降落”,然后在附近寻找能量最低点。当您电脑上的“探测器”——rosetta 在它附近找到了最低能量的蛋白质结构时,会把结果传送回服务器。服务器将会比较和检验所有送上来的结果,从而找到最低能量的蛋白质结构。

起初,我们会利用一些通过非常复杂的试验方法所找出来的蛋白质结构。将计算出来的蛋白质结构和试验中找到的结构相比较。如果它们是相同的话,那么我们就得出了准确找到最低能耗蛋白质结构的方法,我们会转向使用这条新的捷径来确定一些重要的,带有未知结构蛋白质的构成。这项研究被誉为生物界中的“圣杯”。而有了您的帮助,我们能更快地摘取它。

您知道,这个最低能耗的蛋白质结构只能有一台机器找到。这就像买彩票中奖一样,机率是很小的。您的电脑投入的时间越多,成功的机率就越大。我们将跟踪报道这些幸运电脑。而电脑的拥有者也就是那位分布式计算者会得到特殊的积分和祝贺通告。详见我们的 Top Predictions 页。

祝您“计算愉快”! 还请您告知您的朋友和亲戚关于我们和分布式计算的消息。 让更多的人加入进来。 Rosetta@Home 是一项最重要的科学探索项目。 而这可以通过分布式计算来解决。

再次感谢您的参与!!

David Baker

华盛顿大学生物化学系教授
霍华德·休斯医学研究所(HHMI)研究员