
来源:Albozagros
西藏的遗传学和历史吸引了许多人。说实话,主要原因在这里是海拔。青藏高原一直是那些在生物和文化上适应极端条件的人们的堡垒。这自然意味着对藏族人进行了相当多的人口遗传学研究,因为缺氧是高海拔生活的一个副作用,它会显著影响健康。我以前讨论过关于这个主题的文章。考虑到在2012年ASHG大会上传来的消息,我将来可能还会继续讨论。但要理解自然选择对一个群体的影响的特征,经常非常重要的是要牢记系统发育的背景。我的意思是,进化过程发生在历史中,这些历史事件塑造了随后现象的进程。具体来说,要理解藏族人是如何适应高海拔的,就必须了解他们与谁有关,以及他们的长期历史是什么。《分子生物学与进化》杂志上有一篇论文试图做到这一点,现代人类在青藏高原的旧石器时代定居和新石器时代扩张的遗传证据
藏族人生活在世界上最高的高原上,目前人口近500万,其中大部分生活在海拔3500米以上。因此,青藏高原是研究人类人口历史的文化和生物学研究的非凡区域。然而,青藏高原的定居时间线仍然是人类史前史一个未解决的问题。为了重建现代人类在青藏高原的史前定居和人口历史,我们系统地对来自青藏高原整个地区41个地理区域的6109名藏族个体进行了抽样,并分析了藏族人群中父系(n=2354)和母系(n=6109)谱系以及全基因组SNP标记(n=50)的系统地理模式。我们发现,现代人类进入青藏高原存在两次截然不同的、主要的史前迁徙。第一次迁徙以大约30000年前的古藏族遗传特征为标志,表明现代人类最早的青藏高原定居发生在旧石器时代晚期,而不是新石器时代。我们还发现了藏族人和汉族之间相对较新(仅7-10千年前)的Y染色体和线粒体DNA单倍体共享证据,这表明在新石器时代早期有第二次迁徙浪潮。总而言之,遗传数据表明,自旧石器时代晚期早期定居青藏高原以来,藏族人就一直适应高海拔环境,在末次冰期最盛期之前,随后发生了人口的快速扩张,这与新石器时代早期高原上的农业和牦牛畜牧业的建立同时发生。
我认为需要强调的两个主要突出点是:1)mtDNA和Y染色体谱系的大量样本量2)藏族人是由超过10000年前到达高原的农业居民和可追溯到旧石器时代的狩猎采集者组成的。

引用:Cai, Xiaoyun, et al. "Human migration through bottlenecks from Southeast Asia into East Asia during Last Glacial Maximum revealed by Y chromosomes." PloS one 6.8 (2011): e24282. 这篇论文有很多问题让我感到困扰。对其论点的最广泛解释我倒是觉得可信,但在细节上我却感到怀疑、困惑,比开始时更加好奇。另外,我需要补充的是,我曾与2012年ASHG大会上展示了这篇论文的海报的人交流过,但我不知道他们是否是作者。他们看起来很好,但也并不一定完全专注于他们正在探索的问题,而是专注于获得庞大的样本量并应用标准方法。说到样本,最引人注目的一点是他们的样本偏向于今天的“西藏腹地”,即自治区。但藏族人在历史上一直生活在四川等地。只有50%的藏族人居住在自治区,但他们样本的90%以上来自该地区。就探索对高海拔的适应而言,这是可以的,但如果要做系统地理学,我想你需要更好的地理覆盖范围。但这只是一个小小的题外话。论文的主体是一系列Y染色体和mtDNA单倍体分组以及聚结时间。其中一些结果对我来说非常有说服力。有些Y染色体谱系表现出“星状”系统发育,这通常意味着近期人口快速扩张。使用其他方法,作者推断在10000多年前农业引入后确实发生了人口扩张。没有充分的理由可以怀疑这一发现。然而,深入研究却带来了巨大的困惑,我不确定聚结时间和系统发育是否真的如作者所假设的那样。例如,这是一篇论文中呈现的标准分析
我们在父系(Y染色体 D3a-P47 和 O3a3c1-M117)和母系(M9a1a 和 M9a1b1)谱系中都发现了新石器时代早期人口扩张的分子信号(10-7千年前)(表1)。单倍体共享和藏族与汉族之间分歧时间的详细分析表明,高原上的新石器时代人口扩张很可能是由大约10千年前起源于中国西北部地区的最早的新石器时代汉族农业居民的扩散引起的……
O3a3c1-M117 的频率接近~30%,并且如上所示,与中国人有关。这与其他最近的研究结果相吻合,这些研究暗示藏族人和中国人之间相对较近的共同祖先。这个结果可以通过混合人群会给出两个极端之间的平均结果来解释。我的问题是,我怀疑10000年前是否存在汉族人,就像我怀疑10000年前是否存在希腊人一样。

引用:Cai, Xiaoyun, et al. "Human migration through bottlenecks from Southeast Asia into East Asia during Last Glacial Maximum revealed by Y chromosomes." PloS one 6.8 (2011): e24282. 快速的文献检索发现 M117 在中国南部和东南亚北部的一些特定的非汉族居民中最为常见。我并不是在这里提出苗族人将M117引入藏族。相反,我想说,最好谨慎假设我们了解一个地区在有任何书面记录之前的6500年前的遗传单倍体分组的族群分布!对我来说,存在一个所谓的汉藏语系的事实,强烈表明分化发生在10000多年前,而不是10000年前就存在汉族。历史记录清楚地表明,大约3000年前,长江(现在是华北和华南的非正式分界线)是汉族人口占主导地位的区域的边界。即使在那时,华北平原本身也显然存在着“蛮夷”族群!约10000年前的农业扩张,如我们今天所理解的汉族,其可能性根本站不住脚。汉族在东北亚的人口和文化主导地位是过去3000年(最多慷慨地算4000年)的现象(南中国在后汉朝灭亡约公元200年之后,尤其是唐朝约公元600-950年,才在一定程度上被汉化)。许多论证因为这些时代的错误假设以及将当代单倍体分组频率随意推断到古代人口分布而显得摇摇欲坠。古代DNA的研究表明了这一点在欧洲的危险性,这应该更新我们对这类分析稳健性的先验认知。例如,作者们对Y染色体谱系的缺乏结构以及它们在藏族地区广泛的聚结时间感到好奇。为什么这是一个问题?因为如果这些Y染色体谱系是旧石器时代的,那么各分支之间的深层汇合也应该与地理差异相对应。但它们并不。对我来说,最简单的解释是,过去10000年发生了大量的人口流动,随着农业的开发,青藏高原将截然不同的人群聚集在一起。然而,这给从目前的分布推断古代地理联系带来了问题,因为它打开了移民的可能性,以及剧烈的人口遗传-人口变动。总的来说,我想说这篇论文是有趣且有用的,但你应该仔细阅读它,不要过多地相信作者的推断。这些推断基于可能建立在错误基础上的假设。补充:另外,PCA图上的“缺口”并不一定意味着长期孤立,正如他们在文本中所说的那样。它可能仅仅是采样不足的函数。见上文。有许多没有根据的说法,比如那些。但是,我想补充的是,作者在拉萨本身发现了大量的“外来”单倍体分组,这与我们所知的西藏文化历史是一致的。藏传佛教实际上更多地受到南亚(特别是孟加拉)佛教的灭绝变体的影响,而不是中国佛教。虽然喜马拉雅边境的人口泵似乎是从高地流向低地,但也有例外。而这些例外往往在拉萨发现。引用:Cai, Xiaoyun, et al. "Human migration through bottlenecks from Southeast Asia into East Asia during Last Glacial Maximum revealed by Y chromosomes." PloS one 6.8 (2011): e24282.













