
长期以来,评估特定科学论文的重要性一直是一项棘手的任务。目前的系统依靠计算论文被他人引用的次数来确定它对后续研究产生了多大的影响,但一项新研究指出,这个数字可能具有误导性。简单地
计算引用次数会偏袒像生物学这样的学科,因为生物学论文往往被引用得更多,而像数学这样的领域,引用频率较低。此外,一篇相对边缘论文的引用与一位在重要期刊上发表文章的顶尖研究者的引用具有相同的分量 [Scientific American]。
为了试图解决这些问题,一对研究人员决定采取不同的策略:他们采用了谷歌用来确定搜索结果中网页排名的算法,并用它来对科学文章的重要性进行排名。谷歌 PageRank 算法通过检查每个网页被链接的次数来确定其重要性,这相当于计算引用次数。但它还有其他几个非常有用的方面,当应用于科学论文排名时。该算法对引用来自只列出少量参考文献的论文的引用给予更高的权重,也对引用来自本身经常被引用的论文的引用给予更高的权重。
“由于这些特性,PageRank 能够轻松识别出大量的科学‘瑰宝’——引用次数不多但包含开创性结果的文章” [arXiv]
,研究人员写道。在研究人员的首次实验中发现的这些瑰宝中,有九篇是由未来的诺贝尔奖得主撰写的。在一项描述于Journal of Neuroscience([需要订阅,但论文可在arXiv上免费获取])中的实验中,研究人员通过将谷歌的 PageRank 算法应用于美国物理学会系列期刊中发表的 350,000 多篇文章来检验他们的理论。他们考察了该集合中文章之间的引用,发现大多数情况下,PageRank 系统和基于引用数量的排名识别出相同的科学重要文章。但有一个转折。
有趣的是,他们发现了一组异常值,其 PageRank 值远远高于仅基于引用数量的预期值。您可能会认出其中一些作者:Bardeen, Cooper, and Schrieffer;Weigner and Seitz;Onsager;Kohn and Sham;Feynman and Gell-Mann。事实上,十个异常值中有九篇是诺贝尔奖获奖论文,第十篇 Cabbibo 的“Unitary Symmetry and Leptonic Decays”可以说是诺贝尔奖历史上最大的疏漏 [Ars Technica]。
尽管研究人员在结论中认为,在评估研究质量方面,统计数据无法与科学判断相抗衡,但毫无疑问,一些好奇的人们已经将该算法应用于更近期的论文集,试图嗅出下一位诺贝尔奖得主。相关内容:80beats:荧光水母蛋白研究获得诺贝尔化学奖 80beats:粒子物理学家获得诺贝尔物理学奖 80beats:病毒猎人获得诺贝尔医学奖图片:维基百科













