|
发表于 2007-6-7 19:13:45
|
显示全部楼层
一个孩子的染色体,实际上是他祖代染色体无法复原地混杂、拼凑而成的大杂烩,而且一直回溯到远祖都是如此。原想要的古代经文,它的字母,可能还有单词,也许能够原封不动地代代相传。然而章、页、甚至于段,却被无情而有效地撕碎后重新粘贴到一起;这种破坏可以说是非常无情,以至从跟踪历史踪迹的角度来看几乎一无用处。凡涉及世系,性总是一个巨大的障碍。
只要性确实没有牵涉进来,我们就能利用DNA档案来重现历史。我想到两个非常重要的例子。一个就是非洲夏娃,我下面会讲到她。另一个例子,是重现更久远的祖先——着眼于各个物种之间的亲缘关系,而不是物种内的亲缘关系。我们在前一章中已经看到,有性繁殖只发生在物种之内。当一个亲本物种建立了一个子代物种时,基因之河就分成两条支流。等到它们分岔时间足够长,远离它作为档案管理员的障碍之时,每条支流中的有性繁殖实际上有助于重建物种问的世系和亲缘关系。只是在涉及物种内部的亲缘关系时,性才把证据搞乱。对于种间的亲缘关系来说,性只有助益:它倾向于自动地确保每一个体都是整个物种的优良遗传样本。
在搅拌均匀的河水中,你从哪里打一桶水都一样,哪一桶水对那条河的水都具有代表性。
为了画出物种的系谱,事实上已对取自不同物种典型样本的DNA文本进行过逐字的比较,并且很成功。根据一个有影响的学派的说法,甚至能够在分岔的地方标出日期。这种机会来自尚有争议的“分子钟”概念,该假说认为:基因文本任一区域内每百万年发生突变的速率是恒定的。我们很快就要回到关于分于钟的假说上来。
在我们的基因中,描述一种称为细胞色素C的蛋白质的“段落”共有339个字母。马与我们的亲缘关系相当远,人类细胞色素C与马的细胞色素C有12个字母的改变。猴子是我们相当近的亲戚,人类细胞色素C与猴子的细胞色素C只差一个字母。驴是马的近亲,马与驴的细胞色素C也仅有一字之差。此外,猪与马的亲缘关系稍远,它们的细胞色素C之间有3个字母不同。人与酵母的细胞色素C之间有45个字母的差别,而猪与酵母之间,也同样是45个字母的差别。这两组数字的相同并不令人奇怪。沿着人类的基因之河溯流而上,就会发现,人与猪的基因之河汇合的时间,要比它们一起与酵母的基因之河汇合的时间近得多。但是,在这些数字当中也有一个小小的污点。马与酵母的细胞色素C相差46个而不是45个字母。这并不意味着对酵母来说,猪比马的亲缘关系更近些。它们同为脊椎动物,并且,实际上,还同为兽类,与酵母的亲疏程度是完全一样的。或许,在与猪的最近的共同祖先之后,在演变到马的世系中,不知不觉地出现了一个额外的变化。这并不重要。总体说来,各对生物之间细胞色素C字母差异的数目,与前述进化树分杈的想法所推断的情况十分吻合。
前面提到的分子钟学说认为,一个基因文本每百万年的变化速率是大体固定的。关于区分马与酵母的46个细胞色素C字母变异,一般认为,其中大约一半是发生在从它们共同祖先到现代马的进化过程中,大约另一半发生在从它们共同祖先到现代酵母的进化过程中(显然,这两条进化途径经历的时间是完全相同的)。最初,这种假设似乎令人惊讶。毕竟,它们的共同祖先很可能更像酵母,而不那么像马。自从著名的日本遗传学家木材元(MotooKimura)率先表示支持之后,对于该假设的一种调整,即基因文本中的大部分可以自由改变,而不影响基因文本的含义,已经逐渐被接受。
在一句句子中采用不同字体就是一个很好的比拟。
“马是一种哺乳动物”。“酵母是一种真菌。”尽管在这两个句子里,每个词都采用了不同的字体,但它们的意义却十分明晰。数百万年间,分子时钟滴嗒滴嗒地送走了相当于毫无意义的字体变化的那些东西。由自然选择决定的变化和描述马与酵母之间差异的变化——也就是句子在意义上的变化,则是冰山的尖顶。
有些分子的时钟速率较另一些分子快。但细胞色素C的进化相当缓慢:大约每2500万年有一个字母变化。这或许是因为,细胞色素C对生物生存极其重要,其作用主要取决于它的具体形状。
在这种形状至关重要的分子里发生的大多数变化,是自然选择所不能容忍的。其他一些蛋白质,如血纤维蛋白肽,虽然也很重要,却有多种能同样起作用的形式。血纤维蛋白肽能使血液凝固,你可以改变它们大部分的细微结构,却不会损害它们的凝血能力。这些蛋白质的突变速率为每60万年左右发生一次变化,比细胞色素C快40多倍。因此,血纤维蛋白肽可以用来再现比较晚近的世系,比如在哺乳动物范围内,但是,却不能用它们来再现古老的世系。不同的蛋白质有几百种,每一种都有自己特有的变异速率,因此,每一种都可以独立地用于重建系谱。它们产生出的都是几乎一模一样的系谱。顺便说一句,这就很好地证明(如果需要证据的话)了进化论是正确的。
我们已经认识到,性的混杂搞乱了历史记录,并由此展开了我们的讨论。我们已经找出两条途径,可以避开性的干扰。前面就其中之一进行了详细讨论。我们的讨论基于这样一个事实,即:性不会把不同物种的基因混合在一起,这就为我们提供了这样的可能性:利用DNA序列来重建我们远祖的系谱,这些远祖生活在我们成为人类之前很久。但是,我们已经同意,如果我们回到足够久远的过去,那么无论怎么说,我们全人类肯定都是同一个体的后裔。
我们还曾企图找出,最近到什么时候,我们仍然可以宣称与其他所有的人是同一血统。为了找到答案,我们不得不转而求助于另一类DNA证据。由此,非洲夏娃走进了我们的故事。
非洲夏娃有时也称为线粒体夏娃。线粒体是微小的菱形小体,成千上万地充满我们的每个细胞。它们内部基本上是空的,但具有复杂的膜结构。这些膜的面积,比你从线粒体外表所能想象的要大得多,而且很有用。这些膜是一座化学工厂(更确切他说是一座发电厂)的生产线。受到精确控制的链式反应沿着这些膜进行,这个链式反应的步骤,比任何人类化工厂里的反应步骤都要多。结果,源自食物分子的能量在控制之下一步步地被释放出来,并且以可再利用的形式储存下来,以便往后不论体内什么地方需要,随时都可以用于燃烧。若没有线粒体,我们一秒钟内就会死去。
这就是线粒体的功能,然而我们在这里更关心的是线粒体是从哪儿来的。原来,在久远的进化历程中,它们曾经是细菌。这一杰出的理论是由阿默斯特市马萨诸塞州立大学可敬的林恩。马古利斯(Lynn Margulis)首先提出的。这一理论最初曾被视为异端邪说,当时只有少数人对它发生了兴趣,现在已经被广泛接受,可以说是大获全胜了。在20亿年前,线粒体的远祖是独立生活的细菌。后来,它们与其他种类的细菌在较大的细胞里“定居”。所形成的(“原核”)细菌群落又变成大的(“真核”)细胞。我们每一个人都是数以百万亿计的互相依存的真核细胞群落。每一个这样的细胞,又是由数千个被驯化的完全封闭在细胞里的细菌组成的群落。它们在细胞里面就像细菌一样地增殖。据计算,如果一个人身体里所有的线粒体首尾相连排成一列,那它将不是绕地球一圈,而是能绕上2000圈。一只动物或一株植物,就是一个由相互作用的不同层次的小群落聚合而成的巨大群落,正如一片雨林。拿雨林来说,它本身就是一个云集了大约上千万种生物的群落,而每一物种的每一成员本身又是一个群落,它又有许许多多由被驯化的细菌组成的群落。马古利斯博士关于起源的学说——细胞好似封闭的细菌乐园——决非伊甸园的故事所能与之相比,它更令人激动、令人兴奋、令人振作。它还有另一个优势,那就是它几乎可以肯定是真实的。
如同大多数生物学家一样,我现在也设想马古利斯学说是正确的,在这一章里我提到它,只是为了继续探讨一个特别的含意:线粒体有它们自己的DNA,同其他细菌一样,仅存在于一个单环染色体内。现在我们就这一点进行探讨。线粒体DNA不参与任何性的混合,不与躯体的主“核”DNA混合,也不与其他线粒体DNA混合。像很多细菌一样,线粒体只通过分裂来增殖。每当一个线粒体分裂为两个子线粒体的时候,每一个子线粒体得到与原有染色体一模一样的“拷贝”。从我们系谱学者的观点来看,现在你该看到它的妙处了。我们发现,在我们担心普通的DNA文本每一代都被性搅乱证据,混淆了来自父系和来自母系的贡献的所在,线粒体DNA却有幸独善其身。
我们仅仅从母亲那里得到线粒体。精子大小,只能容纳少数的线粒体;它们所能产生的能量,只够在精子游向卵子时提供精子尾巴作动力;受精时,精子的头部被卵子吸收,而这些线粒怀则同精尾一道被抛弃了。相比较而言,卵子的个体巨大。在卵子庞大且充满液体的内部,包含着丰富的线粒体种质。这些线粒体种质进入子代的身体。因此,无论你是女性还是男性,你的线粒体全部都来自最初接种的你母亲的线粒体。无论你是男性还是女性,你的线粒体全部都来自你外祖母的线粒体。你的线粒体,无一是来自你父亲,无一是来自你祖父或外祖父,无一是来自你祖母。线粒体构成了对于往昔的独立记录,没有被主细胞核的DNA所沾染,而主细胞核DNA是均等地来自你4位祖父母中的每一位,你8位曾祖父母中的每一位,等等,依此往前类推。
线粒体DNA虽不受沾染,却不能避免突变,即复制中的随机差错。而且,它的变异率比我们“自己的”DNA要高。这是因为,就像所有的细菌一样,它不具备我们的细胞在千万年间逐步形成的精确的校对机制。在你我的线粒体DNA中会有几处差异,根据差异的数量,可以推测出你我的祖先是在多久以前分岔的,这里所说,不是所有的祖先,而是我们在女性一女性一女性……一线上的祖先。如果你的母亲是位纯种的澳大利亚土著居民,或者是一位纯种的中国人,或者卡拉哈里土著居民,那么,你我的线粒体DNA之间确实会有许多不同。至于你父亲是谁就无所谓了:他可以是一位英国侯爵,或者是一位苏族首领,对你的线粒体都没有影响。你所有的男性祖先也都一样。
因此,就有了一本单独的线粒体《次经》,它与主要的家庭圣经一起代代相传,并有一个很大的优点:只由母系往下传。这种观点并不是性别歧视,如果它由父系传下来,也丝毫不差。其优点在于完整性,在每一代都既不会被割裂,也不融合。作为DNA系谱学者,我们需要的是纯粹单一性别,而不是两个性别都有的世系。
如同姓氏一样,Y染色体只由父系传下来,从理论上来说也同样是适用的,但是它所包含的信息太少而派不上用处。把线粒体《次经》用于确定同一物种内共同祖先的年代是非常理想的。
一组研究人员曾与伯克利加州大学已故的阿伦.威尔逊(ALlan WiLson)合作研究线粒体DNA。80年代,威尔逊和他的同事们曾从全世界抽样了135名妇女进行线粒体DNA序列调查。这些妇女中有澳大利亚土著人、新几内亚高地人、美洲土著人、欧洲人、中国人,以及非洲多个民族的代表等。他们逐对研究了每个妇女与其他各个妇女线粒体DNA字母差异的数目。他们将这些数目输入计算机,要求计算机构建出它所能找到的最简便的家族树系。
“最简便的”在这里是指尽量排除假设性一致。这点需要作些解释。
回顾一下我们在前面进行的关于马、猪、酵母等的讨论,以及对细胞色素C字母序列的分析,你就会回忆起,马与猪之间只有3个字母不同,猪与酵母之间有45个字母不同,而马与酵母之间,这种不同的字母有46个。我们曾指出,从理论上讲,由于有比较近的共同祖先把马和猪互相联系在一起,所以它们各自与酵母的距离应该完全一样长。45与46的差异是一种畸变,在一个理想世界里不应存在。它或许是由于在马的进化过程中出现过一次额外的突变;或许是在猪的进化过程中出现过一次相反的突变。
这儿确实存在着一种荒谬的观点。在理论上可以设想,猪与酵母的关系要比它与马的关系近。在理论上,猪和马逐步形成如许相以之处(它们的细胞色素C文本只有3个字母不同,而它们的身体基本上是一模一样的哺乳动物模式),有可能是出于种种巧合。
我们之所以不相信这一观点,是由于猪和马相像的地方比猪和酵母相像的地方多得多。不可否认,在一个DNA字母上,猪与酵母更为接近,然而这被猪与马之间其他方面无数的相似之处压倒了。
理由是最简便。如果我们假设猪与马的关系近,我们只需接受一个因巧合形成的相似之处;如果我们假设猪与酵母的关系近,我们就必须假定一连串的相似之处都是互不相干地因巧合而形成的,其数量多到不现实的程度。
在马、猪和酵母的相互关系问题上,上述的简便理由是显而易见,无可置疑的。但是,人类不同种族的线粒体DNA相似程度极高,这是没有什么可怀疑的。“简便”的理由仍然存在,但只表现为微不足道的数量上的论据,而不是有力的、决定性的论据。从理论上说,计算机要做的工作是:列出全部有关135名妇女的可能的家族树,然后检验这一系列家族树,从中选出最“简单化”的一种,即因巧合而致的相似之处最少的一种。我们必须面对这样的事实:即使是最好的家族树,也可能迫使我们去接受一些小的巧合,就像我们被迫接受如下事实:从一个DNA字母的角度看,酵母距猪更近些,离马更远些。但是,至少在理论上,计算机应该能够轻易地完成这一任务,并向我们展示,在众多可能的家族树中,哪一棵是最“简便”的,也就是巧合最少的。
这只是在理论上。但在实际上存在着一个障碍。可能的家族树的数量,比你、我,或任何数学家所能想象到的要大得多。在马、猪和酵母一例中只有3种可能的家族树。显然正确的一种是[(猪、马)酵母],猪和马一起,被放置在内括弧里,而酵母则是无关联的“局外者”。另外两种理论上的家族树,是[(猪、酵母)马]和[(马、酵母)猪]。如果我们再加上第四种生物,比如就鱼,家族树的数目就会上升到15个。我不想一一列出所有这15种家族树,但是愿举出正确(最简便)的一个,即「(猪、马)鱿鱼]酵母。猪和马作为近亲又一次舒适地被放置在最内层的括弧里。下一个参加该俱乐部的是鱿鱼。跟酵母相比,它与猪/马世系拥有更为晚近的共同祖先。其他14个家族树中的任何一个,比如「(猪、鱿鱼)、(马、酵母)],肯定都不够简便。如果猪真是鱿鱼的近亲,马确实是酵母的近亲,那么,猪和马极不可能各自独立地发展了如此多的相似之处。 |
|