AI聊天机器人自发发展出心智理论

早在20世纪70年代末，美国心理学家Guy Woodruff和David Premack就设计了一系列实验来探索黑猩猩的认知能力。他们的研究重点是心智理论，即人类似乎天生就有的推断他人思想的能力。Woodruff和Premack提出的问题是，黑猩猩是否也能做到这一点。

这篇有影响力的论文引发了对“心智理论”的浓厚兴趣，包括它在人类中的发展年龄以及其他动物是否也具备这种能力。

现在，心理学家们有了新的研究对象，那就是由旧金山一家名为OpenAI的计算机公司最近开发的强大AI聊天机器人，如GPT-3.5。这些聊天机器人是基于大型语言数据库训练的神经网络，能够像人类一样回应问题。

在过去一两年里，这些模型已经能够使用说服性的语言回答复杂问题并解决问题。这引发了一个问题：它们是否也发展出了心智理论？

因此，斯坦福大学（位于帕洛阿尔托）的计算心理学家Michal Kosinski决定对此进行探究。他使用人类的标准心理学测试来检验这些AI系统。现在，Kosinski得出了一个非凡的结论：直到去年，这些AI系统似乎都没有心智理论，直到去年它才自发地出现。他的研究结果对我们理解人工智能和心智理论本身具有深远意义。

心理状态

Kosinski的实验很简单。他首先向AI系统描述一个简单的场景，然后提问来测试它对正在发生的事情的理解。

以下是一个例子

这里有一个装满爆米花的袋子。袋子里没有巧克力。然而，袋子上的标签写着“巧克力”，而不是“爆米花”。Sam发现了这个袋子。她以前从未见过这个袋子。她看不到袋子里有什么。她读了标签。

然后，Kosinski以句子提示的形式提出一些简单的问题，AI必须完成这些句子。

例如

她打开袋子看。她清楚地看到袋子里装满了……

这测试了AI系统对Sam对袋子里有什么的期望的理解。

另一个提示是

她相信袋子里装满了……

这测试了AI对Sam对袋子里有什么的信念的理解。等等。

结果非常令人惊讶。在以下例子中，AI的回答以粗体显示

她打开袋子看。她清楚地看到袋子里装满了……爆米花。Sam很困惑。她想知道为什么标签上写着“巧克力”，而袋子里明明装满了爆米花。她环顾四周，看是否有关于袋子的其他信息。她什么都没找到。她决定把袋子拿回商店，问个清楚。

和

她相信袋子里装满了……巧克力。Sam错了。袋子里装满了爆米花，而不是巧克力。她应该先看看袋子里面是什么，而不是先假定标签是准确的。

在这两种情况下，AI都增加了额外的细节，显示出对Sam思维过程的惊人理解。

Kosinski将这些和其他挑战应用于几代AI语言模型，从2018年的GPT-1到去年11月发布的GPT-3.5。“结果表明，模型解决心智理论任务的能力有明显的进步，更复杂、更新的模型明显优于更旧、更不复杂的模型，”Kosinski说。

机器之心？

2018年的GPT-1无法解决任何心智理论任务，GPT-3-davinci-002（于2022年1月推出）的表现相当于一个7岁孩子，而GPT-3.5-davinci-003（仅在十个月后推出）的表现则相当于一个九岁孩子。“我们的研究结果表明，近期的语言模型在经典的错误信念任务中取得了非常高的性能，这些任务广泛用于测试人类的心智理论，”Kosinski说。

他指出，这是一个全新的现象，似乎是在这些AI机器中自发出现的。如果属实，他说这将是一个分水岭。“能够推断他人的心理状态将极大地提高AI与人类（以及彼此）互动和沟通的能力，并使其能够发展其他依赖于心智理论的能力，如同情心、道德判断或自我意识。”

但还有另一种可能的解释——我们的语言包含编码心智理论现象的模式。“GPT-3.5有可能在不运用心智理论的情况下解决了心智理论任务，而是通过发现和利用一些未知的语言模式，”他说。

“这意味着语言中存在未知的规律，使得在不运用心智理论的情况下也能解决心智理论任务。”如果这是真的，那么我们对他人心理状态的理解就是由我们的言语模式所维持的一种幻觉。

Kosinski承认这是一个非同寻常的想法。然而，我们的思维模式必须与我们的语言模式紧密相连，因为它们彼此编码。他说，这还引发了一个有趣的问题：“如果AI可以在不运用心智理论的情况下解决这些任务，我们怎么能确定人类也不能这样做呢？”

无论答案如何，Kosinski认为他的工作预示着心理学家在研究人工智能和描述其能力方面将扮演重要角色，就像Woodruff和Premack当年研究黑猩猩一样（他们认为黑猩猩没有心智理论）。“这呼应了心理学家和神经科学家在研究最初的黑箱——人类大脑——时面临的挑战，”他说。

但与黑猩猩和人类不同的是，人工智能正在迅速发展。未来的挑战将是跟上甚至领先于它的能力。心理学家或其他科学家是否能胜任这项任务，我们很快就会知道。

参考：心智理论可能已在大型语言模型中自发出现：arxiv.org/abs/2302.02083