
许多情感隐藏在“很久很久以前”和“从此幸福快乐地生活在一起”之间的文字中。有些是快乐的瑰宝,有些肯定会引发噩梦。那么,当你打开一本故事书时,你怎么知道你会发现什么情感呢?一种新的工具通过获取故事的“情感温度”来消除猜测。这种数据挖掘工具由加拿大的一位计算机科学研究员设计,他分析了数字谷歌图书语料库中从格林兄弟到莎士比亚的一切内容。该工具统计了与八种基本情感相关的 14,200 个单词的使用情况,这八种情感是:快乐、悲伤、愤怒和恐惧,以及信任、厌恶、惊讶和期待,从而得出情感温度计,从而更好地了解故事的情感内容,而不仅仅是通用的流派或关键词。研究人员发现,莎士比亚的哈姆雷特充满恐惧和厌恶,而皆大欢喜则表现出更多的快乐和信任。原型温度计的最佳部分(在 arXiv 中的一篇研究 [pdf] 中描述)是,它可以搜索这些情感——研究人员最终旨在使其公开可用的一项功能。你想看一些恐怖的东西吗?该工具可以告诉你格林兄弟童话中哪个是最黑暗的。你的文学教授是否正在寻找夏洛克·福尔摩斯中的悬疑例子?只需搜索悬疑即可。它允许你根据书籍唤起的情感来选择书籍,就像 Netflix 允许你指定想要一部以坚强女性为主角的时代剧一样。读者还可以放大特定的童话故事,例如找到白雪公主的哪些部分最能激发惊讶。或者缩小范围以比较作者、流派甚至整个图书馆的情感温度趋势。尽管通常较短,但童话故事往往比小说表现出更广泛的情感范围。有了这样的工具来缩小谷歌图书中现在拥有的 520 万本书籍的范围,书迷们应该很快就能从此幸福快乐地阅读。或者根据具体情况,愤怒地/恐惧地/惊讶地永远阅读下去。通过 the Physics arXiv Blog
顶部图片来源:Alan Bailey/Shutterstock













