Genomes Unzipped, 规模很重要,以及从医学遗传学中获得的其它经验教训
广告
...
规模较小的研究,无法检测到这些微小的效应,本质上是随机的p值生成器。有时p值是“显著的”,有时则不然,这与变异是否真正与疾病相关无关。
此外,由于研究人员通常只关注单个基因中的少数变异(通常只有一个!),并且他们坚信该基因与疾病有关,因此他们经常能够对数据进行子集划分(例如,区分男性和女性),以在某个亚组中找到“显著”的结果。 这与发表阳性结果并搁置阴性结果的倾向相结合,导致了一篇相互矛盾且令人困惑的文献,实际上阻碍了医学遗传学的发展。
容易批评的一点是对“p值”的依赖,即统计显著性的阈值。仅仅因为某件事是统计上显著的,并不意味着它有实质内容。统计显著性只是一个数字,盲目地坚持大多数人类努力中的数值标准,往往会导致偏见和对测量手段的“游戏”。p值会随机分布,为了发表,你只需要在0.05的阈值以下“钓鱼”即可。这表明退一步思考,真正思考你的结果意味着什么以及你是如何得出这些结果的,是多么重要。(如文章所述,这在许多领域都是一个问题,可能最令人担忧的是医学和制药研究)













