广告

征服者留下的基因遗产

探索加勒比地区的人口遗传历史,揭示波多黎各泰诺血统和欧洲混血的见解。

作者:Razib Khan
Google NewsGoogle News Preferred Source
克里斯托弗·哥伦布

新闻简报

注册我们的电子邮件新闻简报,获取最新的科学新闻

注册

几年前,当一些进化基因组学家报告说,他们通过重组当代已混血人群中保存下来的碎片,重构了波多黎各已灭绝的泰诺人的基因组时,曾引发了一场小小的争议。争议在于,一些人今天声称自己是泰诺人,因此,他们并非一个已灭绝的种族。虽然这场争议最终平息了,但这些方法却得以保留并继续使用。现在,一些曾参与那项研究的人们又公布了他们的最新研究成果,他们利用基因组学技术重构了加勒比地区(包括沿海和大陆地区)的近期人口历史。更好的是,它完全开放获取,因为它已发布在arXiv上,《加勒比地区人口遗传历史的重构》(请也参阅Haldane's Sieve 上的评论,由我本人发起)。尽管作者们整合了各种数据集(例如 HapMap、POPRES、HGDP),但重点关注的是上图地图中突出显示的人群。

广告

结果中许多新颖的见解源于他们对加勒比地区人群中存在一个明显“拉丁裔”人口遗传群体,并且与欧洲人群有强烈亲缘关系的观察。这在他们的 ADMIXTURE 分析中清晰可见。他们所做的是整合各种人群,并运行一种方法,将每个个体的祖先分解为 K 个祖先群体的组合。当整合的人群清晰且独特时,结果也会清晰且独特。例如,如果你有 50 个芬兰人和 50 个尼日利亚人并将他们整合,然后在 K = 2 的情况下运行 ADMIXTURE,并且拥有大量的 SNP(10,000 个就绰绰有余),那么根据这些基于模型的聚类方法,所有芬兰人和尼日利亚人都将分成两个不同的祖先群体。但必须始终记住,尽管这些方法能够反映现实,并让我们对数据集中的变异有所了解,但 K 本身是人为的构建。例如,众所周知,HGDP 玛雅人群体具有重要的欧洲基因流动。如果你使用这种玛雅人群体作为你的“美洲原住民”参考,那么你将会低估混血群体中的美洲原住民祖先,因为你的参考美洲原住民群体已经偏向欧洲人(当你没有合适的参考,例如泰诺人那样已灭绝的群体时,这显然是一个主要问题)。

在这些初步警示之后,我们来看看结果。正如你所见,许多加勒比地区的人群是各种大陆“父母”群体的直接组合。这在 K = 3 时非常明显,其中绿色代表非洲,红色代表欧洲,蓝色代表美洲原住民(请注意,正如我所说,玛雅人具有一系列欧洲血统)。通过观察人群内的个体变异,你已经可以获得一些关于混血性质的见解。在墨西哥,欧洲血统与美洲原住民血统的比例范围很广,尽管在这个数据集中没有“纯粹”的个体。此外,非洲血统在人群中的比例较低,但相对均匀。尽管在非洲意识形态上,非洲血统并不是现代墨西哥民族认同的主要组成部分,但非洲血统的人是西班牙殖民企业的重要组成部分(参见《帝国:西班牙如何成为世界强国,1492-1763》)。在一些地区,例如韦拉克鲁斯,有明显非洲血统的人仍然存在,但在墨西哥大部分地区,这些人与当地人通婚,他们的外貌特征被稀释到几乎看不见的程度。

海洋加勒比地区的情况则更为复杂。在这些地区,是美洲原住民血统,而不是非洲血统,被吞没和淹没。是基因组学“重新发现了”这种血统,以至于许多学者此前曾怀疑现代波多黎各人和多米尼加人是否继承了大量泰诺血统。在波多黎各和多米尼加共和国,相关的问题在于非洲和欧洲血统的比例范围很广,而古巴则是这一现象的突出极端案例。古巴之所以如此,是因为有晚期来自西班牙的移民潮,所以一些现代古巴白人受混血影响的程度要小于其他加勒比人(请记住,古巴直到 1898 年都是西班牙的一部分)。在海地,情况则相反,18 世纪末和 19 世纪初的革命带有种族色彩,白人被驱逐(留下了少数混血阶层)。

但真正有趣的是 K = 8。黑色成分是与拉丁裔人群(包括玛雅人)特有的类似伊比利亚半岛的欧洲成分。正如你在 PCA 图上看到的,拉丁裔成分与伊比利亚半岛的人群有关,因为他们将来自加勒比地区人群的欧洲片段提取出来,并用它们来丰富祖先分布。对此有几种解释。 Dienekes 认为这可能仅仅是几百年前的伊比利亚半岛人群与当代人群有所不同。例如,显然当代西班牙人比他们在新大陆的表亲更容易受到 1600 年后与其他欧洲人的基因流动影响。另一种可能性是,对西班牙某个特定地区的抽样非常极端,从而导致其单独成为一个群体。例如,我知道移民中来自安达卢西亚和埃斯特雷马杜拉的比例过高。但这里的模式并不支持我的这种可能性(我认为如果来自这两个省份,黑点应该更偏南)。

相反,他们似乎倾向于认为这种成分由于瓶颈效应而偏离了祖先群体。这在民族志上并非不可能;西班牙殖民实验的早期是以事实上的一夫多妻制为特征的。许多冒险家过着与 18 世纪末东印度公司白人巨头相似的生活。有人认为,这个普遍存在的非法一夫多妻制时期影响了拉丁美洲非法出生率历来很高这一事实。作者们倾向于瓶颈模型的一个原因是,拉丁裔成分与伊比利亚成分之间的遗传距离相当大。这在漂移/瓶颈效应迅速改变等位基因频率的情况下很常见。不仅如此,这种趋势在沿海拉丁美洲最为明显,该地区许多岛屿比广阔的大陆总督辖区接收到的后续移民相对较少。

23andMe 为一位 1/4 亚洲血统的朋友进行的祖先分解

作者们探索人口历史的另一种方法是观察祖先片段的长度分布。这个原理很简单。第一代混血儿将拥有来自父母双方的未断裂的祖先片段,但后续几代会开始出现片段化,因为重组会打断长条的相同祖先。你可以在左边的图表中看到这一点,我那位有亚洲祖父母的朋友拥有交替出现的欧洲和亚洲祖先片段,这是由于减数分裂重组事件造成的。混血发生的时间越长,片段就会变得越小,因为重组会分割长片段并重组祖先成分。通过观察长度的分布和组合,作者们可以构建人口的人口统计学历史。简而言之,看起来大部分欧洲祖先是在定居早期,以一个短暂而快速的脉冲式进入的。这与当时欧洲男性由于一夫多妻制而产生的生殖率较高的情况相符。

对非洲血统也进行了相同的分析,作者们发现了一个令人着迷的结果。看来,在早期,加勒比黑人奴隶主要来自撒哈拉以南非洲的西端,从塞内加尔河一直到现在的加纳。后来,较长的片段显示出与东部更远的地区,从贝宁湾到赤道地区的人群有亲缘关系。我不太了解奴隶制历史,无法证实或否定这一发现的真实性,但这说明了基因组学结合广泛抽样策略的强大功能。更相关的是,我认为基因组学的作用将是量化已知动态的幅度。

最后,作者们还推断出加勒比地区人群中美洲原住民混血的各种关系。他们证实了中美洲和加勒比地区存在从南到北的移民证据,以及现在事实上的已灭绝的加勒比人口与南美洲大陆人口之间的特定民族语言关联。其中一些结果早已被提出,但由于历史文献的缺乏,推断模糊不清。基因组学无法解决这些争论,但它们能为此提供启示。

总的来说,这是一项有趣的研究,因为我认为它是基因组学将用于回答的那类历史-人口问题的一次试验。长期以来,许多生态学家和系统发育学家都信奉“基因组学作为一种工具”的理念,现在,在更多样化的领域,你将拥有“基因组学作为一种工具”来与之一并使用。加勒比和拉丁美洲地区是唾手可得的成果,因为西班牙和葡萄牙的殖民实验有相对充分的记载,而且源头人群非常独特(因此很容易在噪音中分辨出信号)。但同一时期还有其他历史问题也同样有趣。在《阿尔比恩之种》中,David Hackett Fisher 描述了塑造这个国家文化的四种盎格鲁-美洲民俗。其中,约 20,000 名清教徒于 1620-1640 年间抵达,到 1970 年已繁衍成约 700,000 人。虽然 20,000 人不算一个瓶颈(事实上,他们来自英格兰的不同地区),但我很好奇,这些被称为“老美国人”的群体,是否仍然可以在基因组数据中辨认出来。这只是未来不久就能得到解答的众多可能问题之一……

广告

引用arXiv:1306.0558

保持好奇

加入我们的列表

订阅我们的每周科学更新

查看我们的 隐私政策

订阅杂志

订阅可享封面价高达六折优惠 《发现》杂志。

订阅
广告

1篇免费文章