数量遗传学家我多年来一直提到20世纪初孟德尔主义者(他们是遗传学的前身)和数量遗传学家(他们是经典的达尔文主义者)之间的冲突。正如在黑格尔辩证法中所述,这种自负的冲突最终导致了成为群体遗传学的综合。历史过程在Will Provine的《理论群体遗传学起源》中得到了优美的概述,但当时它在R. A. Fisher 1918年的论文《基于孟德尔遗传假说的亲属相关性》中结出了果实。有人可能会争辩说,尽管这篇出版物结束了明显的辩论和分歧,但现实是差异仍在继续,不是因为**根本**差异,而是因为实际差异。经典的群体遗传学家专注于单基因或双基因位点模型,以发展他们对进化过程轨迹的直觉。数量遗传学家完善了他们对连续性状的推理统计技术,这些性状的可遗传性得到了证实,但其特定的因果遗传元素仍然是未知的。

遗传学家在基因组时代之前,情况不可能不同。没有“大数据”和“大硬件”(即计算),数量遗传学丰富但混乱的经验工作和群体遗传学优雅而分析性的景象被方法学鸿沟隔开。从底部构建的多基因模型对于进化遗传学家来说根本不可行。而没有基因组学,在高度多基因性状中确定因果位点的可能性不大,对于数量遗传学家来说也不是必需的。**但这种情况正在改变,在Fisher融合了两个领域理论公理的开创性论文发表一个世纪后。** 这不是一件小事,**因为适应性进化发生在受多基因变异影响的连续性状上。** 数量性状的细微可遗传差异几乎肯定有遗传基础,但当这种变异分布在成百上千个位点时,现实必须保持抽象。人们可以对进化过程的广泛流动做出有根据的断言,但无法深入了解其运作的细节。而这些数量性状值得注意。诸如2型糖尿病和精神分裂症等疾病似乎有可遗传的成分,但其可能的进化起源充其量是模糊的。随着大型数据集的可用性,理论家们现在正在苏醒,并试图关闭Fisher打开的书。在Haldane's Sieve 上,他们发布了一篇有趣的预印本,标题为多基因局部适应的群体遗传学特征。其主张似乎带有一种宏大的谦逊。
对多基因表型的选择性适应是通过许多位点细微的等位基因频率变化发生的。目前的群体基因组学技术尚未能很好地识别这种信号。在过去十年中,关于多基因性状具体位点的详细知识已开始通过全基因组关联研究(GWAS)出现。**在这里,我们将GWAS的知识与稳健的群体遗传学模型相结合,以识别已发生局部适应的性状。** 使用GWAS数据,我们将给定表型的平均加性遗传值估计为许多群体中等位基因频率的简单加权和。我们假设在中性条件下,GWAS位点在群体间的预期分化,以开发跨越任意数量群体和任意群体结构的简单选择检验。为了找到特定环境变量在局部适应中作用的支持,我们测试其与估计遗传值的相关性。我们还开发了一个通用的局部适应检验,以识别估计遗传值在群体间的离散度。此检验是基于GWAS预测的QST /FST比较的自然推广。最后,我们提出了一个框架,以识别对离散度信号做出贡献的个体群体或群体组。由于这些检验寻找具有相似效应的等位基因之间的正协方差,因此其功效远大于单一位点等效检验。我们将检验应用于人类基因组多样性面板数据集,使用了六种不同性状的GWAS数据。该分析揭示了许多假定的局部适应信号,并讨论了这些结果的生物学解释和注意事项。
如何实现?对于本博客的大多数读者来说,数学可能会有些棘手,但勇敢的读者可以直接阅读预印本。我想说的是,该论文中概述的方法似乎试图解释多基因性状所承受的多种多价作用力。分散的微弱选择自然是微妙的,很容易被掩盖和混淆。人们必须做的是将基因组内的模式与从系统发育和地理位置预测的中性预期进行比较。写起来很容易,但在计算机时代是完全不可行的。我将提供的主要经验结果是**他们发现关于2型糖尿病相关位点的选择证据很少。** 这并非结论性,但它确实增加了“节俭基因”的想法似乎相当异想天开的观点。最终,模型构建的任务是乏味的,而且是迭代的。但是,21世纪初已经看到了与20世纪初相同的理论复兴和改革。只会带来好事……**引用:**多基因局部适应的群体遗传学特征。














