智商(IQ)是心理学中引用最广泛、用途最广泛的工具之一,涵盖了百年研究中的数千项研究。旨在衡量人类的先天智力,智商测试通过将几项不同任务的分数汇总成一个数字来代表一个人的认知能力。这些测试也存在许多方法论上的缺陷,而我们才刚刚开始理解它们。
英国心理学家 Ken Richardson(《Understanding Intelligence》的作者)说:“我认为智商测试弊大于利。是时候让我们超越这个在意识形态上容易被腐蚀的机械的智商模型,而对智力有更深入、更广泛的认识了。”
质疑构建
结构效度(construct validity),即任何测试在多大程度上可以被认为测量了其声称的结构,是使用智商作为科学衡量标准的最大问题之一。根据 Richardson 的说法,智商的结构效度不存在:“不是在生物医学和其他科学测量中使用意义上的,也不是知道‘内部’的差异真正反映在‘外部’的分数上。这是因为对于‘内部’发生了什么,几乎没有一致的理论。”
正如 2019 年发表在《记忆与认知应用研究杂志》上的一篇评论所讨论的,通常被称为“一般智力”的实际上只不过是一个统计学上的伪影,是智商测试中相似任务激活相同大脑区域的结果。
另一方面,智商最出名的方面之一是其分数分布的形状。当一群应试者的分数放在图表上时,它们通常遵循钟形曲线——也就是所谓的“正态分布”。人们常说智商自然呈这种分布,从而证明了它是有效的构建。然而,它的平均值被人为设定为 100,标准差为 15。
此外,还有智商的相关效度问题。支持智商的一个常见论点是它与其他构念(如社会经济地位)高度相关,从而证明了其有效性。然而,这一点经不起进一步推敲。智商和社会经济地位之间的大规模相关性也可以被解释为收入和财富对一个人测试条件的影响未被考虑在内。
同样,Richardson 和他的同事们已经揭示,工作绩效,这是智力测试中最受推崇的相关性之一,在经验上是可疑的。他说:“相关性会随着时间消失,并且与之后的工作绩效或其他成功指标几乎没有相关性。”
事实上,工作绩效与智商之间的联系极其脆弱——支撑这种联系的大量研究已经过去几十年了,并且由各种难以比较的测试组成。Richardson 补充说,许多此类研究依赖的工作绩效衡量标准本身就存在严重缺陷,缺乏标准的信度和效度来确定衡量了客观的工作绩效标准。
生物学上的缺陷
此外,还有进一步的生物学论据反对智商的方法论健全性;智商在多大程度上可能具有遗传基础已受到广泛批评。行为遗传学家主要依靠双生子研究(评估同卵双胞胎和异卵双胞胎在特定性状上的相似程度)和全基因组关联研究(GWAS),后者调查整个基因组以寻找可能与特定性状相关的基因。
然而,这两种衡量方法都存在方法论上的问题。心理学家 Jay Joseph 在他的书《双生子研究的问题》中详细阐述了双生子研究如何依赖于双生子和非双生子拥有同等抚养环境的假设——而这一假设常常不成立。
根据 Richardson 的说法,GWAS 经常在表面之下隐藏着许多环境混淆因素。研究人员经常落入虚假假设的陷阱,认为他们已经纠正了这些混淆因素,但使用的测量方法本身就带有额外的混淆因素。这项研究通常表明的不是直接的遗传联系,而是社会不平等通过社会和环境因素代代相传的另一种方式。
阅读更多: 过去的铅暴露使数百万美国人的智商分数下降
此外,这些测量 fortemente 依赖于遗传度的测量,而遗传度本身是基于过时的模型,这些模型没有考虑到最近的基因发现,例如表观遗传学(研究你的环境如何改变你的基因)。“我不确定它是否真的有任何遗传基础,” Kevin Bird 说,他最近获得了密歇根州立大学的博士学位,并专注于研究智商如何助长科学种族主义。
“在过去的几十年里,他们发现的主要一点是,智商分数相似性和遗传亲缘关系之间存在相关性,但这几乎说明不了什么,” Bird 说。
智商作为一个似乎存在许多问题的衡量标准,这归因于其缺乏结构效度、背后有缺陷的遗传学研究以及其有问题的相关性。多亏了少数科学家的工作,我们才开始了解其缺陷的程度。













