广告

类人神经网络使计算机成为更好的对话者

了解人工智能 ANNABELL 如何通过先进的神经网络模仿人类的交流方式,从而推动自然语言处理的进步。

作者:Ben Thomas
Google NewsGoogle News Preferred Source

新闻简报

注册我们的电子邮件新闻简报,获取最新的科学新闻

注册

斯坦利·库布里克 1968 年的电影《2001 太空漫游》中的电脑主角 HAL 9000,以发光的红“眼”示人,它令人恐惧却又充满魅力。(图片来源:YouTube 截图。如果你曾尝试与像 CleverBot 这样的聊天机器人进行对话,你就会知道,无论你多么努力地试图维持下去,对话多么快就会变得毫无意义。但现在,由意大利萨萨里大学应用物理学副教授 Bruno Golosio 领导的一个研究团队,在改善人机对话方面迈出了重要一步。Golosio 和他的同事们构建了一个名为 ANNABELL 的人工神经网络,旨在模仿大脑中人类工作记忆的大规模结构——以及它进行对话的能力,这种能力惊人地像人类。

广告

自然语言处理

自 20 世纪 40 年代以来,研究人员一直在尝试设计能够理解人类语言并做出连贯响应的软件。该领域被称为自然语言处理(NLP)。尽管业余爱好者和专业人士每年都将他们最好的 NLP 程序 输入到竞赛中,但过去七十年来,仍然没有出现一个 NLP 程序能够让计算机持续地欺骗提问者,让他们误以为在与人类交流。NLP 多年来吸引了各种各样的研究方法,语言学家、计算机科学家和认知科学家一直专注于设计所谓的符号架构,即以符号形式存储语音单元的软件程序。这是一种需要大量自上而下管理的 [方法]。

另一学派

另一种观点,即“连接主义方法”,认为通过人工神经网络(ANN)来处理语言更为有效。这些计算机系统从一张白纸开始,然后学会将特定的语音模式与相互连接的处理单元集群关联起来。这种开放式的结构使得 ANN 能够以非常少的直接监督,在运行中建立连接——这与人脑的工作方式非常相似。两种方法之间的关键区别在于,符号架构在做决策时需要特定的规则,而 ANN 则不那么受制于僵化的结构。ANN 不会检查答案是否正确或错误,而是选择最有可能正确的答案。在自然语言处理方面,这种方法更加通用,并且更擅长生成听起来像人类的答案。

ANNABELL 是一个由人工神经元组成的认知架构模型,它从一张白纸开始学习使用人类语言进行交流。(图片来源:Bruno Golosio)受到早期 ANN 成功的启发,Golosio 和他的团队设计了一种全新的 ANN,称为 ANNABELL(具有自适应行为用于语言学习的人工神经网络)。该团队设计 ANNABELL 能够通过从零开始构建相互关联的联想系统来学习语言,就像人类婴儿一样。为了给 ANNABELL 提供合适的工具,Golosio 的团队围绕一个非常特定的人类风格记忆模型设计了他们的网络。

工作模型

记忆通常分为短期和长期存储。短期记忆容易检索也容易丢失,而长期记忆形成需要更长时间,但会保留下来。许多研究人员还增加了第三个类别,即工作记忆,有时被描述为“对当前时刻的记忆”。你是否曾问过某人:“你刚才说什么了?”然后开始重复你捕捉到的句子的一部分——却惊讶地发现自己记住了整个句子,并能逐字复述?这就是你的工作记忆系统在起作用。Golosio 和他的团队知道,一个围绕多组件工作记忆模型设计的 ANN 可以成为处理和创建类人交流的强大工具。“例如,如果有人问你‘你最喜欢的电影是什么?’” Golosio 解释道,“你可以将注意力集中在‘电影’这个词上,并使用这个词作为线索,从长期记忆中检索信息到工作记忆中,就像你在谷歌上输入一个关键词一样。” 类似于使用谷歌,你大脑工作记忆中的每个“搜索结果”都包含指向关于该主题更详细信息的存储的链接。Golosio 的团队希望在 ANN 中模仿这种搜索和链接功能,他们希望这种方法能将 ANNABELL 推向一个新的人类化水平。

正确且连贯

ANNABELL 的构建块是在强大的计算机中模拟的神经元。计算机并不试图模拟真实神经元每秒进行的数百万次化学反应,而是根据从网络中其他模拟神经元接收到的输入,计算每个神经元激活的可能性。与生物大脑一样,一起激活的数字神经元会连接在一起;并且这种微调神经连接强度(从而微调某个神经元激活触发其他特定神经元激活的可能性)的能力,赋予了 ANNABELL 学习新联想的能力。

(图片来源:Golden Shrimp/Shutterstock)到目前为止,这个描述适用于任何神经网络,但 Golosio 和他的团队将 ANNABELL 推向了更高层次。他们以一种模拟人类工作记忆的语言组件的方式构建了 ANNABELL 的大规模神经连接。这意味着 ANNABELL 可以专注于或“倾听”一组词语,将它们与其他词语和短语联系起来,探索组合词语的各种可能方式,并在正确回答问题时获得“奖励”。一旦 ANNABELL 的神经结构到位,Golosio 和团队就向该系统输入了大量的词语和句子数据库:人与人之间的关系描述、身体部位描述以及动物与其类别之间的关系。他们还包含了母子之间的对话样本和一个基于文本的虚拟房屋。

闲聊

然后,研究人员询问 ANNABELL 关于它所学到的知识,结果令人瞩目。ANNABELL 在回答与人物数据集相关的百分之八十二点四的问题、与身体部位数据集相关的百分之八十五点三的问题,以及与分类数据集相关的百分之九十五点三的问题时都给出了正确答案。此外,在自然对话中,ANNABELL 表现得非常像人类,特别是与其他当前一代的 NLP 软件相比。这些结果于周三发表在《PLOS ONE》杂志上。虽然 ANNABELL 距离完全可以以假乱真还有很长的路要走,但该系统为一种有趣的观点提供了概念验证:可以从一张白纸开始,教会计算机就可能无限的话题进行连贯的对话。在可预见的未来,Golosio 和他的团队计划将 ANNABELL 上传到一个机器人中,机器人可以亲身体验世界,并学习就这些经历进行交流。这意味着明天的聊天机器人将不仅连贯,而且能够谈论它们在现实世界中真正经历过的事情。

保持好奇

加入我们的列表

订阅我们的每周科学更新

查看我们的 隐私政策

订阅杂志

订阅可享封面价高达六折优惠 《发现》杂志。

订阅
广告

1篇免费文章