广告

科学侦探揭露研究欺诈

伊丽莎白·比克正致力于寻找科学研究中的重复和伪造,成千上万的人在关注她。

Google NewsGoogle News Preferred Source
比克不再在实验室工作,而是在加州的家庭办公室里搜寻科研欺诈。伊丽莎白·比克提供

新闻简报

注册我们的电子邮件新闻简报,获取最新的科学新闻

注册

本文最初刊载于我们2023年11月/12月刊,题为“科学侦探”点击此处订阅即可阅读更多此类文章。

广告

科学存在一个问题:它是由人类进行的。其中许多人遵循科学方法所概述的规则和程序,并以正直的态度行事。但与社会任何一个领域一样,也有一些不良行为者为了获得优势而作弊。

1912年,一位名叫查尔斯·道森的考古学家结合并改变了人类和猿类头骨的碎片,声称发现了人类与猿类之间的进化“缺失环节”。直到1953年,在新骨骼年代测定技术发明之后,他的骗局才被揭露。尽管道森今天可能无法逍遥法外,但每当一项新技术揭露一个骗局时,总会有另一项技术提供伪造发现的新方法。

其中一个出现这种情况的地方是研究论文中被伪造成结果的图像。幸运的是,荷兰微生物学家、如今的“科学诚信侦探”伊丽莎白·比克正在对抗这种欺诈行为。她作为一名数字义警,在Twitter上积累了超过14万名粉丝。她一丝不苟,有着惊人的细节洞察力和耐心,能够将这些洞察力投入到严肃的工作中。她已经成为识别研究论文中特定类型伪造图像的大师。

关于科学研究中欺诈频率的统计数据很难获得,部分原因是我们可以知道的只有那些被抓获的事件。但像比克这样的工作有助于提供最低估计:她对1995年至2014年间发表的20,000多篇论文的审查发现,3.8%的论文存在问题图。其中约一半有故意篡改的迹象。

比克的最终目标是减少这些不端行为,或者至少引起发表科学研究的期刊的审查和更正。到目前为止,她已经促成了1,000多篇论文的撤稿;实际上,这意味着在线版本的文章通常会增加一个警告标签。这并不能阻止研究人员无意中引用已经下载或打印的副本。但这仍然是一个重要的安全措施,以确保科学家不会以虚假信息为基础进行未来的工作。

在她记录下第7,163篇发现问题的论文时,比克接受了《Discover》的采访,谈论了她是如何从事研究欺诈检测工作、她的工作是怎样的以及这对科学意味着什么。

(图片来源:Amy Osborne/AFP via Getty Images)

Amy Osborne/AFP via Getty Images

问:您的专长是发现图像重复。这意味着什么?

EB:研究论文中有展示结果的图。在某些领域,这些图是真实的图像、真实的照片。例如,一篇微生物学论文可能有一个图,其中包含多个面板的照片,显示了经过不同处理的细胞。当存在重复的图像时,与每个面板都应该是独特的不同,两个面板是相同的。或者,也许两张图像有重叠,这意味着研究人员从同一个样本下用显微镜拍了第二张照片,但只是稍微移动了一下,使得其中一些相同的细胞出现在两张图像中。当然,如果他们只是稍微远一点地移动了样本,我就找不到重叠之处了。所以,我实际上只能发现冰山一角——我只能捕捉到可能发生的实际欺诈的一小部分。

问:您认为是什么促使人们从事科研欺诈?

EB:科学家存在发表文章的压力。而且,有时会有霸凌的教授。有些实验室由傲慢自大的人管理,他们可能会对年轻的研究人员说:“你的实验为什么失败了?我会找别人来让它成功。我会解雇你,让你回去。”许多研究人员可能持有签证在国际上工作,如果他们被解雇,他们必须在几周内返回自己的国家。我认为在这种情况下,研究人员会感到压力,为了达到教授的要求而捏造结果,而且每个人都害怕说出来。研究生和博士后研究员可能是进行照片编辑的人,但谁应该为实验室的氛围和诚信负责?那应该是教授。

问:您是如何开始这项工作的?

EB:我在荷兰出生和长大,然后在斯坦福大学工作了15年,研究人类和海豚的微生物组领域。在那里,我开始对抄袭感兴趣——巧合的是,我调查的博士论文之一的图像是重复的。我意识到自己有识别这些东西的天赋,于是我开始扫描生物医学文献来寻找它们。

广告

我专注于那些有照片图像的论文,比如分子生物学和肿瘤学领域的论文,并且使用了我从自己研究中熟悉的那些技术。我开始系统地扫描,因为我想知道:这类图像的出现频率有多高?在20,000篇论文中,我发现4%的论文存在这些重复的图像。我这样做了一段时间,然后又作为一名行业科学家工作了几年,同时继续将图像重复工作作为一项爱好。

(图片来源:Amy Osborne/AFP via Getty Images)

Amy Osborne/AFP via Getty Images

问:这现在是全职工作吗?

EB:最终,在2019年,我意识到我谈论我的图像重复工作的热情比谈论我的工作还要高。我决定第二天辞职,这实际上是可持续的。我创建了一个Patreon账户,让支持者可以捐款来资助我的工作,这让我处于一个独特的位置,可以揭露这些不良论文:我不必担心我的工作,因为我没有工作。而且我职业生涯已经足够晚,不必担心我的职业生涯。并不是我超级勇敢,而是大多数人无法在不损害自己职业生涯的情况下提出这些问题。

广告

问:您如何决定检查哪些论文,以及如何进行检查?

EB:我通常会追踪线索,因为这样做过的研究人员和实验室往往会重复这样做。例如,就在昨晚,我发现了一个在美国的“感兴趣的实验室”,他们与中国的几个“感兴趣的实验室”有过合作。我已经发现了一些可疑的、有重复图像的论文。当我刚开始的时候,我用肉眼寻找重复项,但现在我使用一个名为ImageTwin的软件。它会扫描并提取论文中的所有图像,并将它们相互比较,以及与其他论文中的图像进行比较。它非常擅长查找重叠部分。

当我发现重复项时,我会截图并勾画出重复的部分,然后将其发布到PubPeer上。这是一个在线科学出版物数据库,您可以对作者、出版商和其他科学家进行评论。我尽量不作判断,因为有些重复项可能是诚实的错误。即使很可能是有意为之,我也不会说“这是欺诈”。我尽量保持客观。

从那里开始,论文作者应该会收到PubPeer的自动邮件,他们可以回复。大多数不会。有些期刊或出版商也会收到邮件,尽管许多人会手动筛选关于他们论文的条目。然后,出版商可以决定是否撤稿。

问:您认为这些重复通常是故意的吗?

EB:当仅仅是同一张照片出现两次时,我几乎总是认为这很可能是一个诚实的错误。很容易想象一个科学家可能会拍摄数百张照片并将它们全部放入标记好的文件夹——这是这个样本,那个是那个样本——有一天,他们输入了“三”而不是“二”,碰巧将错误的标签用于他们的论文。是的,这是粗心。是的,他们应该注意到,或者另一位作者应该注意到,但没有人注意到。

广告

但有时一篇论文有很多重复的图像。或者有时你会看到同一张照片出现两次,但经过旋转或镜像处理。在这些情况下,更有可能是故意的。而且有时图像本身已经被修改过,比如一张细胞组织的照片,其中同一组细胞被多次印在图像中。这几乎总是故意的。

问:您是否遇到过整篇论文被伪造的情况?

EB:是的。还有一种情况是,人们可以从所谓的“论文工厂”购买完全伪造的论文。我们发现的论文工厂主要或几乎完全活跃在中国,因为那里的期望很高:医学生和临床医生经常被要求发表科学论文——尽管这些人是医生,他们对研究不感兴趣,也没有时间做研究。所以,他们只是从论文工厂购买署名权。但这篇论文是完全伪造的,由专业人士编写。患者是捏造的。照片可能是真实的,但它们并不代表它们声称代表的内容。而且他们可能会利用人工智能生成伪造的图像。

问:您对人工智能被用于科研欺诈有多担心?

EB:我非常担心。ImageTwin正在寻找重复项,但AI生成的照片是独一无二的——我不确定我是否能识别出精心制作的、完全伪造的显微镜图像。但我们倾向于相信照片,对吧?我们非常依赖我们的眼睛。如果你在一篇科学论文中看到一张照片,你倾向于认为它是真实的,而且它会通过同行评审。但如果我们不再信任照片,我不知道我们会走向何方。任何人都可以滥用AI来生成虚假信息、照片和文字。这正是我担心的,因为我们无法将其与真实区分开来。

问:看来公众对科学的信任最近相当动摇。您觉得您的工作对此有何影响?

EB:不当行为对科学家来说是坏事。但对科学来说也是坏事,因为那些想否认科学的人可能会利用这一点。我认为我所做的工作很重要,因为科学应该是自我纠正的。有时我们的假设可能不太准确,而答案总是比我们想象的要复杂得多。

广告

我研究过7,000多篇论文;980篇已发布更正,1,028篇已被撤稿,但每年有数百万篇论文发表。科学欺诈只是科学的一小部分。我总是提醒人们,我并不是想成为一个科学否认者,而且这是我们解决我们面临的重大问题,如气候变化、流行病以及其他一切问题的唯一途径。我们需要在科学内部保持批判性,以使科学变得更好。

保持好奇

加入我们的列表

订阅我们的每周科学更新

查看我们的 隐私政策

订阅杂志

订阅可享封面价高达六折优惠 《发现》杂志。

订阅
广告

1篇免费文章