
要点:人群之间存在导致“寻求新奇”的基因差异。这些差异可以追溯到非洲迁徙,不能解释为随机遗传漂变的假象。
不瞒您说,当我第一次看到标题“非洲迁徙选择了寻求新奇的基因”时,我有点担心。我立即假设有一篇关于多巴胺受体基因、行为遗传学和地理变异之间相关性的新论文出来了。我猜对了!但我的担心是,这只会是漫长研究中的又一篇,它只是重复相同的结果,而没有为现有证据增添任何新内容。让我明确一点:几十年来,有非常确凿的证据表明,我们周围看到的人类行为的大部分变异是可遗传的。我们的心理倾向的变异,从智力到精神分裂症,很大程度上是由我们的亲生父母决定的。当你查看收养研究时,这一点很清楚,这些研究表明,亲生父母和亲生子女在许多成年指标上表现出高度的一致性,这与抚养孩子的父母不同。这并不意味着环境不重要,但我相信,在当代的时代精神中,我们往往低估了遗传学在个体结果中的作用,就像我们过去可能高估了它一样。此时,你们中的一些人可能会想:“什么,我听说过[填空]基因,而且是经常听到!”那么我为什么要说我们低估了遗传学呢?我认为公众(以及因此而来的大众媒体)对一个特定的生物物理候选基因,它几乎被赋予了魔法般的因果必然性的执着,与更抽象和分散的亲子之间相关性的统计遗传现实,其效应似乎广泛分布在整个基因组中,两者之间存在脱节。后者是一种稳健而普遍的现象,但由于无法将叙事构建为“X基因”,它缺乏力量。相比之下,当您拥有一个效应强大的大基因,其状态变化具有具体且可理解的结果时,叙事清晰、精确且独特。然而,这里有一个不幸的问题
很多时候,这种叙事是错误的,因为它不够稳健。

“语言基因”的例子,FOXP2,最广泛地说明了我所指出的问题。事实上,FOXP2比通常的X基因更适合作为“语言基因”,但最终将FOXP2称为语言基因可能并非总是有用,因为言语能力是一个受许多生物通路影响的复杂性状。所谓的“上帝基因”是X基因的一个更糟糕的例子,可能是我所谈论问题的很好说明。有相当可靠的证据表明宗教信仰具有遗传成分,但没有太多证据表明存在一种信仰上帝的基因。这一切与多巴胺受体和新奇有什么关系?DRD4基因座与许多行为遗传变异有关,多巴胺受体基因常被认为是人格和生活结果各个方面的“主控制器”。多巴胺作为一种神经化学物质具有多种功能,因此其由遗传控制的产生变异自然成为研究人员感兴趣的候选。问题是,这种统计和性感的科学的性质是,会自然而然地倾向于那些后来被证明是假阳性的显著结果。在继续之前,我想重申,作为X基因,多巴胺受体基因座比“上帝基因”更好,但细节决定成败。让我们看看引发《新科学家》文章的那篇论文中的论点。在控制了中性人群基因结构后,寻求新奇的DRD4多态性与人类出非洲迁徙距离相关
大量证据表明,智人在距今15万年前(BP)在非洲进化为一个独特的物种,并于距今约5万年前开始大规模出非洲迁徙。到距今2万年前,我们的物种已有效地殖民了整个旧世界,到距今1.2万年前,智人已全球分布。我们提出,这种快速迁徙到新栖息地,选择了对新应激源反应性低的个体。某些多巴胺受体D4(DRD4)多态性与低神经元反应性、探索行为增加、寻求新奇和冒险有关,这些统称为寻求新奇特质(NS)。之前的一项报告……证明了人类种群的迁徙距离与DRD4基因外显子3的七重复(7R)VNTR等位基因之间存在相关性。然而,这项研究未能解释可能在没有自然选择的情况下产生这种相关性的中性遗传过程(漂变和混合)。此外,现在已知DRD4周围的其他基因座也会影响NS。在此,我们通过模拟人类种群之间中性等位基因频率的非独立性来解释中性遗传结构。我们重新测试了DRD4外显子3等位基因,并测试了DRD4附近与NS相关的另外两个基因座。我们得出结论,迁徙距离与DRD4外显子3的2R和7R等位基因之间存在关联,这不能仅凭中性遗传过程来解释。

我对作者在这篇论文中涵盖所有基础的程度印象深刻。作为自然偏见如何运作的一个例子,如果这只是另一篇将进入记忆深处并成为一个小型简历构建器的论文,你可能就不会阅读这篇博文了。阅读和评论没有提出任何新东西的论文有什么意义呢?那么这里有什么新东西呢?首先,让我们回顾一下DRD4的奇特案例。它是一个基因,和任何基因一样,根据你所查看的区域和变异类型,它有不同的变体。第二点很重要,因为我通常谈论的是单核苷酸多态性(SNP),即特定位置碱基的变化,但该基因座最相关的变异类型实际上是串联重复序列。这些重复序列的数量不同,因此你有不同长度的等位基因。在调查人群中,约90%的变异属于基因外显子3(外显子是编码区)中的2、4和7重复等位基因,分别称为2R、4R和7R。4R重复值可能 ancestral,是全球最常见的变体,而7R变体在新世界很常见,2R在东亚很常见。我上次检查时,你无法从HGDP浏览器获取VNTR多态性,所以我从1996年的论文中提取了你上面看到的条形图,该论文首次测量了这些多态性的变异(绝对是在R时代之前!)。这篇论文的人群覆盖范围有明显的局限性,因为所有新潮的基因组学都首先关注SNP(尽管你偶尔会看到关于拷贝数变异的论文)。随着全基因组的普及,这个问题应该会消除,但这要等到未来。正如你所看到的,4R等位基因在非洲往往是众数,并随着距离的增加而频率降低。2R在东亚更常见,而7R在新世界的一些部落中非常常见。为什么?这就是“新奇寻求”(NS)发挥作用的地方。一个简单的模型是,那些拥有NS等位基因的人更有可能迁徙。因此,排序将是4R > 2R > 7R。所以你谈论的是空间自然选择,而不是时间自然选择。这个模型有几个问题,但最直接的问题之一是,从欧洲和亚洲移民到美国的移民似乎没有表现出你期望的模式,即7R/2R与4R的富集。第二个更大的问题是,当你看到地理分布时,它们可能反映了由于基因频率随机波动而导致的人口历史的随机事件。用通俗易懂的话说,一系列人口瓶颈会导致等位基因频率的梯度,这仅仅是由于简单的遗传漂变+人口历史造成的。拥有更近共同祖先的人群比那些关系较远的人群拥有更多的遗传漂变历史。但让我们倒退一下。重复等位基因和行为之间发生了什么?心理学和神经科学不是我的专长,所以让我引用论文中的话
7R 和 2R 等位基因与 DRD4 介导的前额叶抑制部分丧失有关,原因是第二信使反应迟钝。与 4R 相比,2R 和 7R 等位基因导致细胞内第二信使反应分别减少 40% 和 80%……启动子多态性,包括一个 -521 C/T 单核苷酸多态性 (SNP) 和一个位于起始密码子上游 1.2 千碱基对的 120 碱基对串联重复,与 2R 和 7R 外显子 3 VNTR 等位基因具有相似的神经生理下游效应……DRD4 7R、2R、120 碱基对启动子重复和 -521 C/T SNP 与人格特质新奇寻求 (NS) 之间存在良好支持的相关性……高 NS 个体被认为是探索性、冲动、易兴奋、脾气暴躁和奢侈的,而低 NS 个体则倾向于刻板、谨慎、坚忍、沉思、稳重和脾气温和……
正如您所看到的,除了作为研究焦点的重复序列外,本文还在DRD4基因上研究了另外两种遗传变异:一个SNP和一个重复区域。这些是文献中发现的并且在他们的数据集中评估了15个或更多人群的唯一其他变异。请注意,基因的变异与分子尺度的生物物理变化以及人格差异相关。

此时,我们需要深入探讨这篇论文的核心
他们提出控制DRD4等位基因分布中的人口历史/结构
。问题如左图所示。您可以看到一个SNP的等位基因频率与距赤道距离的关系。这可能是一个功能变异选择的信号,因为环境参数的变化和等位基因频率的变化是相关的。但是,代表等位基因人口总比例的符号也指示了样本的来源区域。显然,存在依赖于来源区域的聚类。因此,您有一组用于生成相关性的点......但这些点显然不是独立的。它们根据地理来源定义的单位聚集在一起。为什么?一个合理的解释是,彼此接近的人口共享共同的进化历史,因此在漂变动力学的作用下,等位基因频率会朝着相同的方向扰动。换句话说,共同的进化历史产生了等位基因频率和地理梯度之间的相关性,因为地理梯度决定了进化历史!DRD4等位基因因迁徙而变化的提议可能存在这个问题。为了纠正这个问题,作者们从非洲扩张的“串联瓶颈”模型开始。因此,所有人类群体都可以通过桑人追溯到一系列奠基者。显然,新世界群体将由最多数量的奠基事件分隔,东亚人和大洋洲人略少,欧洲人和中东人最少。我对此有一些直接的问题,但我稍后会谈到。考虑到这一点,他们构建了一个线性模型,其中有一组变量可以预测结果。在他们的情况下,预测变量将是DRD4等位基因的频率,结果将是迁徙(根据他们的串联瓶颈模型,从原点出发的距离)。他们使用文献中的遗传距离构建了一个相关结构。相关结构是定义这些人群进化历史的一系列关系的系统发育树的代表。换句话说,您期望来自相对亲缘关系密切的人群的基因频率之间存在相关性,而不是来自亲缘关系遥远的人群。为了验证这一点,他们选取了400个经过预先验证的中性等位基因,这些等位基因不受自然选择的影响,因此具有祖先信息,并将其通过控制结构和不控制结构的两种模型。衡量迁徙距离与所涉基因之间关系的平均斜率对于中性标记物为零。换句话说,迁徙距离并非由它们预测。但回归斜率的方差范围很大(这衡量了相关性,因此接近1的斜率表示良好相关,0表示不相关)。请记住,随机情况下会有很多不同的关系。这里是重点:一旦您控制了人群之间的遗传关系,中性基因斜率的变异就大大减少了。它们仍然平均为零,因为这些是中性基因,但是,一旦您考虑了通过遗传距离代理测量的人群间结构,遗传漂变产生区域间人群结构所产生的许多信号就会减少。

主要结果显示在左侧。此图说明了2R + 7R等位基因比例与迁徙距离之间的关系
控制了人口结构。
正如您所看到的,对于这些等位基因,这种关系在统计学上仍然显著(略低于0.05阈值)。另一方面,这种关系对于启动子区域的其他两种变异不成立。这很有趣,因为所有这些变异都被证明在分子遗传学层面以及一些行为遗传学研究中,与多巴胺通路产生相关性。但是
在这种情况下,不能推断非重复变异的DRD4基因与迁徙之间存在遗传变异关系。
这一切该如何解读?我不得不指出,当我读到这篇论文的讨论部分时,我实际上回去重新阅读了他们的引言和结果,因为其语气如此谨慎和含糊,我不确定他们是否真的有积极的结果,以及我是否只是看错了。作者对在不考虑系统发育学的情况下,对行为遗传学上有趣的等位基因进行进化重要性的天真推断提出了非常严厉的批评。此外,他们似乎暗示,人们应该对行为遗传学的结果持怀疑态度,因为这些结果往往不能作为一个整体协同作用。他们指出,许多行为遗传学的结果偏向于患有精神疾病的人群,并且由于资金性质的原因,对正常人类变异的分析并不多。然而,在他们施加了严格的控制之后,7R/2R变异似乎仍然与迁徙相关,因此他们认为这值得进一步调查。我将立即提出的两个批评是他们的人群覆盖范围以及他们的人口历史模型。他们无法控制人群覆盖范围;只有一些群体已经对DRD4基因的VNTR变异进行了分型。但我认为这应该让我们警惕简单地将低于0.05的p值照单全收。谁知道随着覆盖范围的增加,p值会如何变化呢?这是一个好的开始,但需要做更多的研究,正如他们在讨论中正确承认的那样。然而对我来说更重要的是,他们是在非洲迁徙的串联瓶颈框架内工作的。这可能仍然有效……但也可能无效。我们对人类过去和现代人类出现性质的理解现在有些不稳定,因此,这篇论文中简单地被认为是既定事实的一些坚实基础在过去几年中已经变得不那么坚实了。他们假设的一些迁徙,我根本不相信。例如:德鲁兹人 → 柬埔寨人 → 巴布亚人 → 美拉尼西亚人。我可以理解这种可能性,但美拉尼西亚人有南岛语系混血,而柬埔寨人我认为很大程度上来自中国南方的农民迁徙。存在交织和回迁,这会混淆串联瓶颈的想法,即使假设是一个简单的出非洲事件。作者确实承认他们低估了迁徙距离,但我想知道他们的结果在进一步完善后会多么稳健?此外,对我来说,非洲迁徙的串联瓶颈模型太像大约10年前的论点,即现存人群中的大部分遗传变异都可以追溯到距今2万年前的分布。我不知道这是否仍然正确。相反,我们可能有一个重写本,其中许多区域由于农民的扩张而发生了大规模的叠加。最后,许多假设的导致等位基因频率差异的进化压力似乎是特设的或事后的。我们从行为遗传学中得知,“长”和“短”重复序列,7R和2R,会导致新奇寻求。这如何映射到我们看到的文化?以及长期压力如何塑造这些等位基因频率?对7R和2R的原始研究表明,空间选择(即移民是自我选择的)无法解释它,因为现代移民模式……但这在过去有多适用?* 这里有很多问题。总而言之,这是一篇有趣的论文。在我看来,它使DRD4基因成为选择目标的“指针”有所移动。但就具体细节而言,我有很多问题。引文:
Matthews LJ, & Butler PM (2011)。寻求新奇的DRD4多态性与人类出非洲迁徙距离相关,已控制中性人群基因结构。美国体质人类学杂志 PMID:21469077
* 请注意,
《新科学家》的总结在这一点上有点误导。
他们不认为选择作用于迁徙,而是作用于因新环境而迁徙的人群。
图片来源:维基共享资源













