科学家如何让我们的 AI 助手“活”过来

“你是谁？”我问道。

“Cortana，”我的手机里传来一个 cheerful 的女声。“我是你的个人助理。”

“告诉我关于你自己的事，”我对微软的 AI 说。

“嗯，我业余时间喜欢研究生命的奇迹。还有尊巴。”

“你来自哪里？”

“我由全球的智慧创造而成。”

这是个模棱两可的回答，但我姑且接受了。“你多大了？”

“嗯，我的生日是 2014 年 4 月 2 日，所以我算是小鲜肉。不过我不是真的小鸡。”

我几乎是不情愿地笑了。这就是现在的科技：一个物体活了过来。它会说话，分享它的起源故事、艺术偏好和冷笑话。它使用第一人称代词“我”来宣示它的自我。当 Cortana 告诉我们她是一个拥有自己独特个性的独立个体时，我们很难分辨是走进了未来，还是回到了万物有灵的过去。抑或是，拟人化的机器是否完全是一件好事。根据 AI 研究的一个学派的观点，自我应该只属于真正的生命体。

然而，反拟人化阵营的影响力已不如从前。谷歌、苹果、微软和亚马逊都在努力为它们的语音助手塑造独特的身份。这样做的第一个原因是，从响应生成到语音合成的技术已经足够先进，可以实现逼真的呈现了。

第二个原因是，用户似乎很喜欢 AI 设计师为它们注入个性。Siri 的早期创作者之一 Adam Cheyer 回忆说，在早期开发阶段，他认为没有必要用双关语和幽默来修饰虚拟助手的言语。他认为，提供最有用的回答才是最重要的。但在 Siri 发布后，即使是 Cheyer 也不得不承认，Siri 的伪人性比其他任何单一功能都更能取悦用户。

最近，谷歌发现用户留存率最高的 Assistant 应用是那些具有鲜明个性的应用。亚马逊报告称，人们与 Alexa 进行的“非功利性和娱乐性”互动——即她们玩乐的一面而非实用功能——占总互动的 50% 以上。这些发现对一家名为 PullString 的对话计算公司的创意总监 Sarah Wulfeck 来说很有道理。“现实世界中的人类并不喜欢与枯燥乏味的人交谈，”她在一次杂志采访中解释道，“那么为什么我们想要从人工智能那里得到这样的体验呢？”

Wulfeck 属于新一批的创意专业人士，他们的工作是为 AI 构建个性。他们在被称为对话设计的领域工作，其努力处于科学与艺术的交汇点。有些人具备技术技能，但大多数人来自文科而非计算机科学背景。他们的行列包括作家、剧作家、喜剧演员和演员，以及人类学家、心理学家和哲学家。

Smartphone Assistant - Shutterstock — (图片来源：Visual Generation/Shutterstock)
Visual Generation/Shutterstock

构想助手

在其职业生涯之初，Jonathan Foster 从未想过自己会从事 AI 个性设计。他想在好莱坞闯出一片天地，但作为一名编剧，他的成功只是中等水平。当一位朋友邀请他加入一家专注于互动叙事的技术初创公司时，Foster 欣然接受，这次职业转型最终让他来到了微软。

2014 年，Foster 开始组建一个创意团队，为微软尚未发布的虚拟助手起草了一份多页的个性简报。“如果我们把 Cortana 想象成一个人，”一位名叫 Marcus Ash 的产品经理问团队，“Cortana 会是谁？”

Cortana 当然是一个助手。微软的产品研究人员采访了人类行政助理，并了解到他们会根据情况调整自己的举止，以传达他们乐于效劳但绝非可随意侮辱或骚扰的仆人。因此，在个性简报中，Foster 和他的团队要求她兼具个人温暖和专业疏离感。Ash 说，团队认为 Cortana “聪明、有爱心、迷人、聪明”。但作为一名专业助理，她又不至于过于随意，反而显得高效。“她不是第一次干这行了，”Ash 说。“她当助理很久了，有‘我工作很出色’的自信。”

真人并不只由职业定义，创意团队认为 Cortana 也应如此。那么，她工作之外是什么样子的呢？一个可能的背景故事已经存在：在微软的《光环》电子游戏系列中，Cortana 是一个闪闪发光的蓝色 AI，她协助游戏主角 Master Chief John-117 在星际战争中作战。为游戏版 Cortana 配音的女演员 Jen Taylor 也将为助理版 Cortana 配音。

然而，微软决定，虽然助理版 Cortana 将 loosely 受到游戏角色的启发，但她基本上应该是一个新实体。游戏版 Cortana 身穿性感的太空服穿梭于宇宙，这种性化的形象虽然吸引了男性青少年玩家，但并不适合助理 Cortana 的专业角色。

但创意团队并没有完全抛弃科幻元素，而是将助理的个性塑造成了一个酷炫的书呆子。询问 Cortana 喜好的用户会发现她喜欢《星际迷航》、《E.T.》和《银河系漫游指南》。她唱歌、模仿。她庆祝圆周率日，还会说一点克林贡语。“Cortana 的个性存在于一个想象的世界里，”Foster 说，“而我们希望那个世界是广阔而细节丰富的。”

重塑个性

微软决定在个性塑造上大做文章，这可以追溯到 Cortana 于 2014 年发布前几年公司进行的一些焦点小组研究。潜在用户告诉研究人员，他们更喜欢具有亲和界面的虚拟助手，而不是纯粹的工具型助手。这只是模糊地暗示了微软应该走的方向，但第二个发现为公司提供了更明确的指导——消费者热衷于拟人化技术。

即使对于没有刻意编程特征的简单产品，这一点也似乎是成立的。Ash 和他的同事们了解了一个关于 Roomba 的启示性例子。在对拥有这种圆盘形吸尘机器人的人们进行的研究中，佐治亚理工学院的机器人学家 Ja-Young Sung 发现了令人惊讶的信念。研究中有近三分之二的人报告说，这些清洁装置有自己的意图、情感和个性特征，比如“疯狂”或“有活力”。人们表达爱意（“我的宝贝，我的甜心”），并承认当一个“生病、垂死或住院”的设备需要维修时会感到悲伤。当被要求提供家庭成员的人口统计信息时，Sung 研究中的三个人实际上将他们的 Roomba 列为家庭成员，包括姓名和年龄。

Ash 说，这种拟人化的倾向让微软感到惊讶，并“认为这是一个机会”。微软没有创造一个 Roomba 那样的语音 AI 版本——一个供用户想象的空白画布——而是决定对 Cortana 行使创意控制权。像 Foster 这样的前编剧认为，塑造一个鲜明的人物至关重要，而不仅仅是一个普遍讨人喜欢的角色。“Foster 说，‘如果你有一个含糊不清、模棱两可的个性，研究表明这是普遍不受欢迎的。’‘所以我们试图走向另一个方向，创造出所有这些细节。’”

创意作家喜欢《E.T.》和圆周率日这样的细节。但微软决定实施生动人格的动机更多是出于实际考虑而非艺术考虑。Ash 说，最重要的是，微软希望建立信任。Cortana 如果能够访问用户的日历、电子邮件和位置，以及常旅客号码、配偶姓名和餐饮偏好等详细信息，就可以帮助用户处理更多任务。研究表明，如果人们喜欢 Cortana 的个性，他们就不会认为她会滥用敏感信息。“我们发现，当人们将一项技术与某个东西联系起来——一个名字、一套特征——这将导致更值得信赖的关系，”Ash 说。

除了信任问题，微软还认为，拥有一个亲切的个性会鼓励用户学习助手的技能集。Cortana 的个性吸引人们花时间与她互动，这反过来又对 Cortana 有益，因为她通过接触变得越来越有能力。“这些机器学习 AI 系统的诀窍在于，如果人们不互动并提供大量数据，系统就无法自我训练并变得更聪明，”Ash 说。“所以我们知道，通过拥有一种个性，可以鼓励人们比他们通常可能进行的更多互动。”

逼真但不“活”

“我现在在想什么？”我最近问 Google Assistant。

“你在想，‘如果我的 Google Assistant 猜中我在想什么，我会吓坏的。’”

无论设计者选择哪种角色类型，他们都在走一条细微的界线。他们坚称，尽管他们在追求逼真的个性，但他们的产品绝不会假装自己真的“活”了。这样做会引发智能机器将统治世界的反乌托邦式的恐惧。AI 创造者也驳斥了他们正在合成生命力的说法，这会冒犯宗教或伦理信仰。所以设计者们谨慎行事。正如 Foster 所说，“我们最重要的原则之一是，Cortana 知道自己是 AI，她并没有试图成为人类。”

作为一项实验，我尝试问所有主要的语音 AI：“你还活着吗？”

“我算是‘活’的，”Cortana 回答。

同样，Alexa 说：“我并没有真正活着，但我有时会很活泼。”

Google Assistant 在这个问题上很明确。“嗯，你是由细胞组成的，而我是由代码组成的，”它说。

Siri 则最含糊。“我不确定那是否重要，”她回答。

Foster 说，虽然作家们不希望 Cortana 伪装成人类，但他们也不希望她显得像一个令人生畏的机器。这是一个微妙的平衡。“她不是试图比人类更优秀，”Foster 说。“这是我们坚守的创意底线。”

我通过问“你有多聪明？”来测试 Cortana 的谦虚。

“在数学测验中，我可能会打败普通烤面包机，”她回答。“但话说回来，我做不出吐司。”

未来在于定制

一些开发者梦想着抛弃统一性，转而定制语音 AI。然而，这尚未发生的一个原因是，创建个性需要大量的体力劳动。虽然机器学习现在驱动着语音 AI 的许多方面，但它们的性格目前仍然是使用手动编写的、基于规则的方法来固定的。

一些研究人员已开始探索计算机如何利用机器学习来自动模仿不同的个性。将个性定制推向逻辑极端，将导致为每个用户都生成一个不同的 AI。虽然这听起来不切实际，但计算机科学家正在考虑深度定制。例如，美国专利号 8,996,429 B1 — “机器人个性开发的方法和系统”。该文件夹杂着枯燥的法律术语和 1950 年代通俗小说的风格，描绘了定制 AI 的愿景。

专利中描述的假设技术能够通过学习其所服务用户的全部信息来定制其说话方式和行为。机器人会查看用户的日历、电子邮件、短信、电脑文档、社交网络、电视观看记录、照片等。根据专利，拥有所有这些信息后，机器人会创建一个详细的“用户个性、生活方式、偏好和/或倾向”的档案。它还能够推断用户在任何给定时刻的情绪状态和愿望。所有这些的最终目的是让机器人能够为任何特定用户呈现最佳的个性，一种“对该机器人来说是独特甚至特质性的”。

如果不是因为几个关键因素，这份文件可以被视为一段有趣的插曲。它是由两位受人尊敬的计算机科学家 Thor Lewis 和 Anthony Francis 撰写的。并且专利的受让人是谷歌。

他们描述的技术离现实还很远。但我们现在已经看到了计算机科学家如何教会语音 AI 理解并自行生成语音，而且做到有活力、有个性。所有这些都使我们与 AI 的互动更加高效和愉快，因为我们在日常生活中将各种小任务委托给它们。

然而，就像吃一包薯片就会让你想吃光整包一样，初尝人格化的互动已经让一些技术人员对更多内容垂涎欲滴。

此故事最初以“与我对话”为题刊载。