ChatGPT 改变了科学家撰写科学论文的方式。方法如下

科学语言在不断变化。在过去的十年里，各种各样的词语和短语已经从默默无闻走向科学的常用语。其中包括寨卡病毒、埃博拉、ChatGPT 等，这些词语反映了科学研究的起伏以及科学和社会中更广泛的事件和时尚。

这些变化体现在科学家们不断产生的论文、评论和文章中。事实上，各种研究人员已经尝试通过他们产生的语言变化来描绘科学的演变。

这引发了一个关于人工智能对科学影响的有趣问题。自 2022 年 11 月 ChatGPT 公开发布以来，科学家们能够使用大型语言模型来修改、编辑，有时甚至从头开始撰写他们撰写的全部科学论文。但他们实际使用这种 AI 辅助的程度尚不清楚。

历史性的变革

来自德国图宾根赫蒂脑健康人工智能研究所的 Dmitry Kobak 及其同事发现了一种方法，可以衡量自 2022 年以来人工智能系统对科学文献的影响，并将其与科学界其他重大事件的影响进行比较。他们表示，大型语言模型正在以前所未有的规模改变科学话语。

Kobak 和同事首先下载了自 2010 年以来在 PubMed 生物医学数据库上发表的 1400 万篇以上科学论文的摘要。然后，他们清理了数据库中与作者写作无关的常用词语和短语，例如“版权”或“如何引用本文”。接着，他们计算了每年每个三个字母以上的单词出现的频率。最后，他们查看了 800 个最受欢迎的单词，以及它们每年的频率变化。

结果立即揭示了一些明显的科学趋势。例如，“埃博拉”一词的频率在 2015 年达到顶峰，“寨卡”则在 2017 年达到顶峰。2020 年发生的最大变化之一是，在新冠疫情爆发期间，诸如“封锁”、“大流行”、“呼吸道”和“瑞德西韦”等词的使用大幅增加，此次疫情被广泛认为是历史上对科学出版影响最大的事件之一。

但令研究人员惊讶的是，2024 年发生了更大的变化，诸如“深入”、“关键”、“重要”和“潜在”等词的使用增加。奇怪的是，这些词与论文的科学内容无关，而是与写作风格有关。

事实上，研究人员认为，这些正是大型语言模型偏爱的词语。Kobak 及其同事表示：“2024 年过剩风格词语的空前增加使我们可以将其用作 ChatGPT 使用的标记。”

这种变化是深刻的。“在 ChatGPT 可用之后，数百个词语的频率突然增加，”他们说。