1984年,遗传学家从一匹已经灭绝于19世纪末的斑马亚种——拟劢(quagga)——身上提取了229个碱基对的遗传密码。这一成就证明了DNA能够保存在死亡的生物体中,并催生了一个新的科学领域:古遗传学。如今,技术进步使科学家能够从古代人类和其他生物的基因组中解读数十亿个字母,从而改变我们对历史和进化的看法。
位于德国耶拿的马克斯·普朗克人类历史科学研究所的古遗传学主任约翰内斯·克劳斯(Johannes Krause)表示,基因记录“就像一座失落的图书馆……而我们才刚刚开始学习解读我们发现的所有书籍的语言。”
对于人类学家来说,古人类DNA(aDNA)提供了化石或文物无法提供的见解。它已经解决了关于现代人类是否与尼安德特人互动的一些重大争论。古代基因组明确显示,我们的祖先不仅见过尼安德特人,而且在4万到10万年前曾多次与之交配。
2015年,古DNA证实了1996年在华盛顿州发现的、距今8000岁的肯纳威克人(Kennewick Man)的骨骼在基因上与美洲原住民最为接近。这一发现结束了长达20年的法律诉讼,并允许部落重新安葬这些骨骼。

一匹拟劢。(图片来源:Florilegius/Alamy Stock Photo)
Florilegius/Alamy Stock Photo
古DNA也带来了惊喜。2010年,来自西伯利亚的一块小指骨的基因组揭示了丹尼索瓦人的存在,这是一种与尼安德特人同时期生活过的、此前未知的古人类。丹尼索瓦人的古DNA还表明,他们与一些现存人类的祖先发生过基因交流,贡献了有利于寒冷环境和高海拔的基因。
十年前,这些发现是不可能的;遗传学家只能解读古代基因组的短片段。因此,研究要么集中在特定的基因,要么集中在DNA的狭窄部分:雄性Y染色体或母系遗传的线粒体DNA。这些短序列不能反映个体的完整血统。为此,研究人员需要来自全基因组的DNA。从活人身上获取DNA并不困难,但从古DNA中提取和测序全基因组DNA是一项艰巨的挑战,因为古DNA会降解成碎片,经历化学反应改变其密码,并且容易被现代DNA污染。
克劳斯说,随着近年来开发出专门的古DNA全基因组分析方法,“古遗传学的力量已被真正释放。”
古DNA研究现在涵盖了50万年的时间跨度和数百个个体,正在重塑我们对重大事件的理解,例如农业的起源和传播。由于古DNA可用于追踪疾病随时间的进化以及人类对其的抵抗力,因此它对医学研究也很有价值。研究人员已经开始致力于识别现代人类独有的基因——从最基本的层面,是什么将我们的物种团结在一起并定义了我们的物种。
1. 提取:在无菌实验室中,骨骼和其他保存完好的组织被清洁、研磨成粉末,并用化学物质溶解,以分离出短DNA链。

(图片来源:Cynthia Schroeder)
Cynthia Schroeder
2. DNA汤:尽管经过清洁,提取物仍然是样本DNA和污染物质的混合物,其中大部分是埋藏在土壤中的微生物。研究人员添加了分子标签,这些标签稍后将充当条形码,选择性地结合DNA以进行盘点和查找特定序列。

(图片来源:Cynthia Schroeder)
Cynthia Schroeder
3. 复制:为了快速准确地读取DNA,计算机必须同时分析数百万份副本。遗传学家通过加热双链DNA使其分离来制作这些副本;然后,酶以每半部分为基础构建新的双链。重复此过程可将两条链变成四条,然后四条变成八条,依此类推,直到数百万条链拥有相同的DNA密码和标签。由于人类基因组有99%以上是相同的,研究人员通常只选择性地复制有差异的部分。

(图片来源:Cynthia Schroeder)
Cynthia Schroeder
4. 测序:在最后一轮复制中,遗传学家用化学方法给不同的核苷酸碱基——更广为人知的字母是A、T、C和G——着色。然后,计算机根据颜色出现的顺序读取代码,同时分析所有具有匹配标签的相同链,以剔除任何错误。
5. 鉴定:研究人员使用多种线索来剔除古代码中的污染物:例如,古DNA链通常短于100个字母,并具有可预测的降解模式。

(图片来源:Cynthia Schroeder)
Cynthia Schroeder
6. 比对:读取到的短链需要排列到全基因组的正确位置。软件根据重叠的代码段和与先前测序的参考基因组的比较将其对齐。
挑战极限
不要对恐龙DNA抱有太大希望。20世纪90年代进行的研究,报告了来自5000多万年前化石的遗传密码,后来已被确认为污染案例。大多数古DNA样本都来自5万年以下、寒冷气候的样本。
尽管古遗传学在技术上不断进步,但它始终受限于保存条件:如果标本不再含有任何DNA,研究人员就无法提取。
生物死亡后,其DNA会分解。分解所需时间取决于温度、埋葬条件和吞噬它的微生物数量等因素。计算表明,在最佳条件——极寒条件下——DNA可以保存约100万年。迄今为止,最古老的完整基因组属于一匹在加拿大育空地区冰封的土地上发掘出的马,其年代被确定为56万至78万年前。我们智人(*Homo*)属中年代最久远的DNA,是来自西班牙*Sima de los Huesos*洞穴中43万年前尼安德特人祖先的一段遗传密码碎片,该洞穴常年保持凉爽的50华氏度(约10摄氏度)。
遗传学家开始在温暖地区取得成功,这很重要,因为人类的大部分进化都发生在非洲。最近,他们发现DNA在颞骨(petrous bone)中保存得最好——回收率高达100倍。来自中东等地的、这个微小而致密头骨部分的样本,已经提供了距今1.2万年的古DNA。
古遗传学的早期重大发现来自偶然发现保存完好的古DNA标本。研究人员从可用的序列中尽可能多地学习。借助当今的古DNA捕获方法,遗传学家可以分析数百个古代基因组来回答特定的问题。新出现的基因历史跨越了从43万年前到今天的全球范围,代表了个人和整个群体。
古DNA图集
最早的美洲基因组(*蒙大拿州,12600年前*)
2014年,研究人员回收了*Anzick-1*的基因组,这是一个与克洛维斯工具(美洲第一个广泛分布的文化遗物)一同埋葬的婴儿。结果证实,美洲原住民主要起源于数千年前迁徙到美洲的西伯利亚人。

克洛维斯工具。(图片来源:Sarah Anzick)
Sarah Anzick
海豹结核病(*秘鲁,1000年前*)
人们认为美洲的结核病是欧洲殖民者带来的,尽管早期原住民的骨骼也显示出该病的迹象。2014年的一项研究在1000年前的秘鲁骨骼中发现了结核病细菌DNA;令人惊讶的是,这并非欧洲菌株,而是一种可能从海豹身上感染的菌株。
最古老的*智人*DNA(*西班牙,430,000年前*)
2016年,研究人员从早年发掘于*Sima de los Huesos*洞穴的化石中挽救了约5万个碱基对的遗传密码。古DNA证实了许多考古学家长期以来的猜测:Sima的古人类是尼安德特人的祖先。

从西班牙*Sima de los Huesos*洞穴发掘出的尼安德特人头骨。(图片来源:Javier Trueba/Madrid Scientific Films/Science Source)
Javier Trueba/Madrid Scientific Films/Science Source
冰河时代移民(*欧亚大陆,7000-45000年前*)
来自51个个体的古DNA显示,最早到达欧洲的现代人类已经灭绝;而从37000年前开始,后续波次迁徙来的移民留下了至今仍然存在的后代。2016年,古DNA分析首次检测到,大约14000年前,可能有一批近东居民迁徙到欧洲。
尼安德特人的曾…曾孙(*罗马尼亚,40000年前*)
2002年在奥阿塞(Oase)洞穴发现的一块现代人下颌骨(Oase 1)含有超过99%的污染物DNA。但在2015年,研究人员测序了足够多的真实密码,证明该男子仅在四到六代之前就有一位尼安德特人祖先。

奥阿塞1号下颌骨。(图片来源:马克斯·普朗克/Svante Pääbo)
马克斯·普朗克/Svante Pääbo
黑死病之前(*欧亚大陆,3000-5000年前*)
2015年,遗传学家在青铜时代欧亚大陆居民的牙齿中发现了引起瘟疫的鼠疫耶尔森氏菌(*Yersinia pestis*)的古DNA,揭示了在历史上记载的瘟疫出现数千年前,非传染性较强的菌株就已感染人类。导致中世纪黑死病和近期疫情的鼠疫菌株大约在3000年前出现,当时发生了一次突变,使*Y. pestis*具有了通过跳蚤传播的能力。
丹尼索瓦洞穴(*阿尔泰山脉,50000-100000年前*)
从西伯利亚发现的一根指骨碎片和三颗牙齿的古DNA样本,揭示了丹尼索瓦人——一种新发现的已灭绝古人类。同一个地点还出土了一块脚趾骨,该脚趾骨产生了迄今为止最高质量的尼安德特人基因组。

丹尼索瓦人牙齿。(图片来源:马克斯·普朗克进化人类学研究所)
马克斯·普朗克进化人类学研究所
最早的农民(*中东和欧洲,3000-14000年前*)
对数百个基因组的分析显示了早期中东农民如何传播到欧洲,与狩猎采集者混合,并适应农业饮食,包括通过乳糖酶基因突变,使人们能够在童年之后继续饮用牛奶。















