马斯特里赫特大学的 Nick J. Broers 在一篇新论文中认为,心理学实验中测量的效应量本质上是毫无意义的。
“效应量”仅仅是效应的幅度。例如,如果我表明在考试前给学生一个苹果平均能提高分数 5%,那么我就可以说苹果的效应量是 5%。
近年来,心理学家们对效应量越来越感兴趣。人们已成功地鼓励在心理学论文中报告标准化效应量,这现在在一些顶级期刊上是强制性的。
报告效应量的论点很有说服力。最基本的一点是,效应量能让我们知道一个现象是否足够大以至于值得关注。一个微小的效应,如果用足够大的样本量来衡量,可能是统计学显著的,但大多数人会认为一个微小的效应并不重要。

人类心灵和身体之间的关系一直是长期推测和好奇的对象。这张 17 世纪的铜版画描绘了一种关于“神圣心智”、“想象力”和“感官”的“世界”如何相互交织的观念。Corbis
然而,根据 Broers 的说法,解释心理学中的效应量存在一个根本性问题。问题在于,很少有心理学理论能够预测任何特定的效应量,如果理论不预测效应量,那么效应量就无法用来判断理论的有效性。
Broers 将心理学理论称为“语言理论”,因为它们是纯粹定性的,这与物理学等理论不同,物理学理论会做出具体的定量预测。
Broers 以认知失调理论为例。该理论的预测之一是,人们会更欣赏自己辛辛苦苦得到的东西。早期对认知失调的两次实验检验都发现了支持预测效应的证据,标准化效应量非常相似,约为 d=0.7。
这些效应量如此接近,可能看起来是支持该理论的有力而精确的证据,但 Broers 并不同意。
人们很容易相信,结果的密切对应为我们提供了关于失调减少效应的真实定量信息。但重要的是要认识到,启发这些实验的语言理论在定量上对认知失调的运作方式没有任何说法。
Broers 指出,这两个实验甚至都不是为了精确量化而设计的。例如,一个实验使用了 5 点量表,另一个使用了 20 点量表来衡量结果(欣赏程度),似乎没有理由选择这些量表。
结果量表的任意性反映了研究者对研究可能产生的任何定量结果的漠不关心。量化的唯一目的是为了能够通过[显著性检验]来支持顺序的理论预测。因此,结论是,观察到的效应量在它们被确立的研究设计之外没有任何意义。
那么,这对心理学研究意味着什么呢?Broers 主张一种“对效应量持中立态度”的心理学,在这种心理学中,重要的是在日益多样的实验条件下证明效应的统计学显著性。换句话说,‘概念性重复’比效应量更重要。
理论知识的真正积累在于实际可行的理论心理学原理的逐渐增加。随着一项研究的成功概念性重复次数的增加,这些心理学原理的适用范围将逐渐扩大,使基础理论既更强大也更具说服力。
近年来,概念性重复受到了一些批评,尤其是在提倡效应量报告的人群中,因此 Broers 的论点可能会引起一些争议(尽管对概念性重复也有赞扬)。
在我看来,这是一篇发人深省的文章,但我不认为 Broers 真正解决了这样一个可能性:即使是语言理论也对效应量做出了隐含的声明。
我认为每个语言理论都包含一个未写明的声明……“而且这个效应并非微不足道”。假设我的理论预测了一个效应,而且这个效应一贯被观察到但极其微小(d=0.01)。很多人会得出结论,我的理论在任何有意义的层面上都不成立,不值得进一步研究。














