只是按按钮

人类遗传学使用主成分分析 (PCA) 来可视化遗传关系，引发了关于相关矩阵中零值的问题。

新闻简报

注册我们的电子邮件新闻简报，获取最新的科学新闻

我不想扯远，但为什么人类遗传学领域使用 PCA 来可视化关系？当我看到像这里展示的那些具有“几何模式”的图表时（尖锐的直角；另一种常见的模式是 Y 形），这告诉我很多样本在许多 Y 变量上都有零值（即，某些群体特有的等位基因）。因此，点的空间排列很大程度上是由于不适当的方法造成的：当许多要相关的变量具有零值时，如何计算相关矩阵？如果真的想使用 PCA，可以计算成对距离矩阵，然后用它代替相关矩阵（主坐标分析）。

我知道一些人类遗传学家会阅读这个博客，所以我认为提出这个问题是值得的。