将您的家谱追溯到 2500 万年前,您会遇到生活在树上的长尾猴类灵长类动物。这些灵长类动物不仅是我们自己的祖先,也是所有其他类人猿——黑猩猩、倭黑猩猩、大猩猩、猩猩和长臂猿——以及东半球的猴子——如狒狒和长鼻猴——的祖先。通过将我们自己与其他灵长类动物进行比较,科学家可以了解我们在过去 2500 万年的进化过程中的线索。直到现在,这些线索大多来自化石以及对类人猿和猴子行为和生理学的研究。但在过去几年里,科学家们开始仔细研究一个新的记录:刻在我们基因组以及其他类人猿和猴子基因组中的记录。
人类基因组的初稿于 2000 年发表,2005 年发表了我们最近的近亲——黑猩猩的基因组。科学家们比较了这两个基因组,以了解我们共同祖先的基因组是什么样的,以及这两个物种的基因组在过去几百万年里发生了怎样的变化。(我在这里写了关于第一波黑猩猩/人类研究的文章)。最大的惊喜之一是,一个研究团队得出结论,黑猩猩和人类的祖先杂交了数百万年,产生了混血儿“人猿”。
但是,仅从两个基因组中能学到的知识是有限的。如果你发现人类和黑猩猩的基因有两种几乎相同但又不完全相同的版本,就很难确定这种差异是如何进化的。为了简洁起见,假设人类版本的基因是 AAAT,黑猩猩版本是 AAAC。(真实的基因有数百或数千个核苷酸长)。人类和黑猩猩的祖先可能拥有 AAAC 版本的基因,而在人类中,C 突变为 T。但也有可能人类拥有祖先版本,而在黑猩猩中,T 变成了 C。甚至可能祖先版本都不是。它可能开始是 AAAA,而在人类中,最后的 A 变成了 T,而在黑猩猩中,A 变成了 C。
摆脱这种僵局的方法是将黑猩猩和人类与第三个物种——最好是另一种灵长类动物——进行比较。但是直到今天,科学家们才有第三种灵长类动物的基因组可供研究。现在他们拥有了猕猴的所有 DNA。
世界上有 22 种猕猴,它们的自然分布范围向西远达直布罗陀,向东远达日本。它们是坚韧、适应性强的猴子,生活在城市和寺庙中。科学家们长期以来一直在研究猕猴以了解我们自己。血型中的 Rh 因子是 Rhesus 因子(恒河猴因子)的缩写,它是在恒河猴中发现的。正是猕猴在科学中的特殊作用,使其基因组排在测序列表的前列。对猕猴基因组中每个基因进行盘点将使这种猴子成为人类生物学的更有用模型。
与此同时,猕猴基因组有望让人类进化更加清晰。人类、黑猩猩和猕猴共享一个生活在 2500 万年前的共同祖先。想象一下,您发现我刚才提到的基因在猕猴中是 AAAC。最简单的解释是,祖先拥有 AAAC,而猕猴和黑猩猩继承了它。只有在人类中,它才变成了 AAAT。现在想象一下,您可以对人类基因组中大约 18,000 个基因中的每一个都做出这种判断。
猕猴基因组团队在《科学》杂志上发表了三篇论文,并设有一个专门的网站。这些论文是最新一系列论文中的一部分,表明进化生物学和医学研究是如何紧密相连的(尽管有毫无根据的说法)。您只需看看主要论文的标题:“恒河猴基因组的进化和生物医学见解。”
科学家们在论文中研究了很多生物学内容,但有四个主题尤为突出:与疾病相关的祖先基因、快速进化的基因、新基因的起源以及基因组寄生虫的传播。在下面,我将逐一介绍……
1. 祖先基因与疾病。有些人携带的基因版本(称为等位基因)会导致疾病或使其易患病。当科学家们研究黑猩猩基因组时,他们发现黑猩猩携带人类疾病等位基因,但却没有患上人类疾病。猕猴基因组团队扩大了这项搜索范围,在黑猩猩和猕猴基因组中寻找与每一种已知人类疾病等位基因相匹配的基因。他们发现了 229 例疾病等位基因恰好是祖先版本的病例。其中一些等位基因相当有害。有些会导致严重的智力迟钝。有些会导致可能致命的新陈代谢缺陷。例如,健康人会把一种叫做苯丙氨酸的化学物质转化为另一种叫做酪氨酸的化学物质,用于构建蛋白质。但基因缺陷会阻止这种转化,导致苯丙氨酸积累到危险水平——这种情况称为苯丙酮尿症。猕猴有苯丙酮尿症基因。但它们却不会被苯丙氨酸毒害。
如果我们考虑到没有一个基因是孤立工作的,这个悖论就不那么令人费解了。基因在由数十个其他基因组成的网络中协同工作。整个网络会随着时间的推移而进化,因为自然选择会微调基因,使其能够成功地协同工作。但是,如果条件发生变化,那些在这些网络中工作良好的等位基因可能会开始工作得很糟糕,而自然选择会偏好新版本的基因。在 229 个基因的案例中,我们似乎正处于那个尴尬的中间阶段,陈旧的等位基因仍在流通。
2. 快速进化的基因。 人类和猕猴的基因组平均有 93% 相同。大约有 11% 的基因产生相同的蛋白质。其他的基因仅在几个氨基酸上有所不同,而另一些则在几十个氨基酸上有所不同。自然选择可能驱动了其中一些差异,但运气也可能。即使是中性突变有时也会仅仅通过偶然的机会而广泛传播。比较基因组有助于科学家区分这些变化。
通过重建猕猴、黑猩猩和人类的祖先基因组,科学家们可以计算出每个分支上的变化。他们可以识别出导致蛋白质结构发生显著变化的突变,以及不改变蛋白质的突变。这些技术甚至可以让科学家区分经历过强烈选择的基因和经历过微弱选择的基因。先前对黑猩猩和人类的研究确定了 35 个经历过强烈选择的基因。将猕猴基因组加入分析,大大地使情况更加清晰。猕猴基因组团队已经确定了 178 个基因。
许多这些快速进化的基因有助于构建免疫系统。考虑到疾病的严重威胁和寄生虫的快速进化,这并不令人意外。意想不到的条目包括两个有助于构建毛发的基因。类人猿和旧世界猴子在这些基因上可能经历了强烈的选择,以适应气候变化或通过英俊的外表吸引配偶。其中一些基因因在癌细胞中产生蛋白质而最为人所知。为了解释这个特别奇怪的发现,我不得不跳到下一个话题……
3. 新基因的起源。 将一个物种的基因与另一个物种的基因进行比较可能会引起严重的头痛。这是因为很难找到清晰的一对一对应关系。人类基因组中的许多基因属于基因家族——由数十甚至数百个序列非常相似的基因组成的群体。其他灵长类动物也有基因家族,但它们的一些家族比我们的基因多,而一些则比我们的基因少。新的猕猴基因组研究很好地展示了这种混乱的局面是如何形成的。在数百万年的时间里,基因会被意外复制。一些副本后来丢失,而另一些则进化成新的形式。
猕猴基因组团队仔细研究了一个特别有趣的基因家族,称为 PRAME 基因。人类有数十个 PRAME 基因,有些人拥有的拷贝数比其他人多。科学家们并不确切知道 PRAME 基因的作用,但从它们通常只在睾丸中产生蛋白质来看,它们似乎在产生精子方面发挥作用。但 PRAME 基因也有黑暗的一面:它们经常在癌细胞中开启。实际上,有许多基因扮演着这种双重角色,多到它们有自己的名字:癌症睾丸基因。用于制造精子的基因对癌细胞来说有非常有用之处——可能是它们能够快速生长和分裂的能力。(有关此联系的更多信息,请参阅我在《科学美国人》一月份关于癌症和进化的文章。)

猕猴团队利用这种猴子的基因组来追溯 PRAME 基因的进化。他们的结果在这个图片中得到了很好的总结。每条线代表一个基因,三组基因分别属于猕猴、黑猩猩和人类,从上到下。
PRAME 基因家族始于一个基因,该基因被意外复制。然后两个新基因变成四个,四个变成八个。这三轮复制早在猕猴、人类和黑猩猩的祖先在 2500 万年前分化之前就已经发生了。这八种 PRAME 基因都可以在它们的基因组中找到。但进化并没有就此停止。在新出现的灵长类谱系中,一些 PRAME 基因由于剪切掉它们基因组的突变而消失。在其他情况下,PRAME 基因再次被复制,从而扩展了这个家族。
但这些新基因不仅仅是旧基因的额外副本。它们获得了序列突变,改变了它们产生的蛋白质的形状。在某些情况下,对这些基因的作用的选择非常强烈。随着这些基因在制造精子的功能上进化,它们可能作为癌症基因变得更有效。理解这一点可能有助于科学家们理解癌细胞如何从中受益。
[[导出错误 -- 不支持的 HTML: <strong italic='true'>4. 基因组寄生虫。 </strong>.]] 比较灵长类基因组表明,灵长类动物特别容易感染重复基因。其中一个原因可能是我们的基因组被大量自我复制的 DNA 片段(称为移动元件)所侵扰。当它们自我复制时,它们有时也会复制普通的基因。
移动元件是各种奇怪的 DNA 块的混合体,它们占据了人类基因组的大约一半。其中许多源自入侵古代灵长类动物的病毒。它们被称为内源性逆转录病毒,与 HIV 有关。但 HIV 是从一个宿主跳到另一个宿主,而内源性逆转录病毒则与宿主基因组融合,并从一代传到下一代。它们的 DNA 随时间发生突变,但在某些情况下,它们仍然保留了制造自身副本的能力,然后将这些副本插入回基因组中。其他移动元件无法自行复制,而是依赖于这些更具病毒性的元件来完成工作。可以说是寄生虫的寄生虫。
移动元件尤其难以测量。编码蛋白质的基因通常有一些非常清晰的标记——例如,告诉细胞何时停止复制它们的指令——计算机可以搜索。另一方面,移动元件可能被突变所掩盖。通过比较同一移动元件的几种不同版本,科学家可以更容易地识别它们。猕猴基因组使得科学家能够做到这一点。事实证明,猕猴、黑猩猩和人类的祖先已经被七种不同的内源性逆转录病毒感染。在三个分支分开后,病毒制造了它们的副本。在人类谱系中,最多只有两种病毒感染了我们,而且它们都困在我们的基因组中。(去年秋天我写了关于研究人员如何复活其中一种病毒的文章。)相比之下,自我们的祖先分化以来,猕猴已被八种病毒感染。我想知道这种差异是否反映了每种物种面临的病毒数量的差异。鉴于我们从黑猩猩和猴子那里感染了 HIV,了解灵长类动物与它们的病毒之间的关系会更有帮助。
移动元件在医学上也至关重要,因为当它们制造自身的新副本时,它们会在基因组中造成混乱。它们可以拾取基因的片段或整个基因,并将它们移动到基因组的其他位置。通常保持沉默的基因可以变得活跃;它们可以响应新的信号。科学家们已将 118 种遗传疾病与移动元件联系起来,包括血友病、乳腺癌和肌营养不良。猕猴基因组团队指出,了解它们在人类和猕猴中的进化将使这些猴子成为这些疾病的更好模型。但他们也认为,移动元件也可以是一种创造性的力量。它们创造了基因的新副本,这些副本可以承担新的功能。它们可以将基因的一部分插入到其他基因中,这是一种自然的基因工程,可以产生新的蛋白质。再次证明,医学和进化是相互交织的。因此,猕猴基因组有助于我们更好地理解我们体内神秘的 DNA 百科全书。
(有关更多信息,请查看《科学》在此处设置的互动网站)。
[猕猴图片由圣安东尼奥西南基金会生物医学研究所的西南国家灵长类研究中心提供]














