一位备受赞誉的神经科学家,他的工作曾为许多脑损伤患者带来希望,如今却声名扫地。
德国图宾根埃伯哈德·卡尔斯大学的尼尔斯·比尔鲍默教授今年早些时候接受了调查。此次调查是在研究员马丁·斯普勒对 Ujwal Chaudhary 等人于 2017 年发表在《PLoS Biology》上的一篇论文提出严重关切后开始的。比尔鲍默是该论文的资深作者。
现在,图宾根埃伯哈德·卡尔斯大学宣布,已有两名神经科学家被认定犯有不端行为(转自)。这两名违规者未被点名,但根据提供的信息,其中一人显然是比尔鲍默,另一人我认为是乔杜里。
根据该新闻稿谷歌的翻译,大学调查委员会建议撤销 2017 年的《PLoS Biology》论文,因发现多项问题,具体包括:
“数据收集过程中的选择性数据选取”
“未能披露数据和脚本”
“数据缺失”
“可能由于不当分析导致的数据损坏”
那么,到底哪里出了问题?
2017 年的论文报告称,通过功能性近红外光谱(fNIRS)这种记录大脑活动的方法,可以与完全闭锁综合征(CLIS)的瘫痪患者进行交流。CLIS 患者有意识,但由于完全瘫痪而无法交流。
使用 fNIRS,乔杜里等人的关键发现是,当 CLIS 患者思考“是”和“否”时,大脑活动模式会有所不同。这表明 fNIRS 可以为患者提供一种在不移动一分肌肉的情况下回答是/否问题的途径。论文中包含四名患者。以下是其中一位患者 F 的关键结果,显示了头部 20 个通道的 fNIRS 响应时间过程。

根据马丁·斯普勒(同样来自图宾根埃伯哈德·卡尔斯大学)的说法,2017 年论文的核心缺陷在于统计分析——问题就出在上面这张图里。正如斯普勒所说:
[作者] 首先对所有试验求平均值,然后对所有会话求平均值,并对这些平均值进行 t 检验。这种分析的问题在于,试验/会话之间的方差通过平均化而被消除,只保留了通道之间的方差。
进行统计检验时,将考虑所有通道的方差,来比较“是”试验的平均值与“否”试验的平均值。由于通道高度相关(不独立),方差会非常低,从而导致错误的结论,即差异具有统计学意义。
在上图的突出显示部分,很容易看出通道之间的不独立性:所有 20 条“是响应”线都非常相似,而 20 条“否响应”线彼此之间也非常相似。通道之间高度相关。
这是将不独立测量视为独立测量的经典统计陷阱之一,我曾经指责许多论文也有此问题。
然而,事情要复杂一些。比尔鲍默和 2017 年论文的部分作者对斯普勒的说法进行了反驳,为其分析辩护。在我看来,这是一个非常苍白的辩护,但看了之后,我也不确定作者在原论文中实际进行了什么分析。这篇论文的写作很混乱,反驳并未澄清多少问题。所以,乔杜里等人可能并没有完全按照斯普勒的指控去做,但我很确定,无论他们做了什么,那都不是有效的分析。
有趣的是,大学报告中并未明确提及这些统计问题,尽管“可能由于不当分析导致的数据损坏”这一项可能有所暗示。
那么,大学委员会究竟发现了什么?据我(通过谷歌翻译)所见,大学报告并未指控比尔鲍默或其同事犯有最严重的欺诈行为,即数据伪造或捏造结果。
相反,委员会发现论文所依据的部分数据缺失,例如,在一名患者身上,“报告了十二天的结果。然而,委员会仅收到了八天的可用数据。” 论文中报告了脑电图(EEG)数据,但这些数据也缺失了。
在不了解详细情况的情况下,很难判断这有多严重。最仁慈的解释是,比尔鲍默和他的团队极其粗心大意。或者,有人可能会得出结论,大量数据缺失的事实令人质疑这些数据是否一开始就存在。
调查还发现,研究期间收集的部分数据已被排除在分析之外,部分原因是“由于调查中的技术问题,部分原因是资深教授的个人决定”,且未披露。这同样可能只是糟糕的科学实践,也可能更为险恶。
然而,在我看来,2017 年论文的统计数据如此可疑,以至于缺失和被排除的数据变得无关紧要。即使数据全部存在且正确,该论文的结果也无法令人信服。事实上,委员会指出,比尔鲍默的一位前同事早在 2015 年 11 月就告诉他,(如果翻译正确的话)“通过统计正确的分析,无法从数据中找到任何显著结果。”
总而言之,这是一个悲伤的案例,因为比尔鲍默的工作曾为患者带来了巨大的希望。他的其他工作可能存在与 2017 年论文类似的问题,也可能不存在,但我认为需要以非常审慎的态度对待。














