广告
我不想扯远,但为什么人类遗传学领域使用 PCA 来可视化关系?当我看到像这里展示的那些具有“几何模式”的图表时(尖锐的直角;另一种常见的模式是 Y 形),这告诉我很多样本在许多 Y 变量上都有零值(即,某些群体特有的等位基因)。因此,点的空间排列很大程度上是由于不适当的方法造成的:当许多要相关的变量具有零值时,如何计算相关矩阵?如果真的想使用 PCA,可以计算成对距离矩阵,然后用它代替相关矩阵(主坐标分析)。
我知道一些人类遗传学家会阅读这个博客,所以我认为提出这个问题是值得的。
注册我们的电子邮件新闻简报,获取最新的科学新闻
我不想扯远,但为什么人类遗传学领域使用 PCA 来可视化关系?当我看到像这里展示的那些具有“几何模式”的图表时(尖锐的直角;另一种常见的模式是 Y 形),这告诉我很多样本在许多 Y 变量上都有零值(即,某些群体特有的等位基因)。因此,点的空间排列很大程度上是由于不适当的方法造成的:当许多要相关的变量具有零值时,如何计算相关矩阵?如果真的想使用 PCA,可以计算成对距离矩阵,然后用它代替相关矩阵(主坐标分析)。
我知道一些人类遗传学家会阅读这个博客,所以我认为提出这个问题是值得的。
1篇免费文章