如何判断你的即时通讯好友是真的还是机器？| Discover Magazine

每年一次，一群计算机科学家和技术专家聚集在卢布纳奖（Loebner Prize）竞赛中，以测试人工智能的持续发展。这项比赛是计算机科学大师艾伦·图灵（Alan Turing）在20世纪50年代提出的著名“图灵测试”的现实演绎：一名人类同时与另一个人和一个机器进行电子对话。如果评委无法区分人与计算机，那么机器就通过了。

比赛的年度获胜者将获得2000美元奖金和一枚铜牌。10万美元的最高奖和一枚金牌从未被颁发过，它仍然保留给第一个回应完全无法与人类区分的计算机——第一台真正能“思考”的计算机（至少根据图灵的定义）。

去年的评委——一群记者、计算机科学家、哲学教授和其他学者——每人都坐在一台屏幕从中分开的电脑前，两侧各有一个聊天窗口。评委们被告知，一边是与一个机器人聊天，另一边是与一个人聊天。

一等奖被授予了Elbot，它是Fred Roberts和Artificial Solutions的智慧结晶。Artificial Solutions是一家为宜家（Ikea）和挪威电信公司（Telenor）等企业创建客服机器人的公司。这台机器欺骗了25%的评委。二等奖被授予了Eugene Goostman，这是由东欧团队Vladimir Veselov、Eugene Demchenko和Sergey Ulasen创建的一个机器人。它欺骗了大约10%的评委。

那么，根据最新的测试，有哪些确凿的方法可以识别出机器人？我们请卢布纳奖组织者、计算机科学专家兼英国雷丁大学（Reading University）控制论系主任Kevin Warwick分享他的最佳建议。

识别机器人的最快捷简单的方法之一是测试聊天者的中期记忆。虽然人类很可能会记住你三分钟前问的“苹果是什么颜色的？”这个问题，但机器人可能不会，所以第二次问同一个问题会得到相同的答案。反之亦然：计算机更有可能重复问同一个问题。以下是亚军Eugene Goostman在中期记忆方面失误的例子：

法官：早上好，你好吗？

Eugene：你好！我今天心情很好。你呢？

法官：我感觉不错，谢谢。你今早吃早餐了吗？

Eugene：很高兴听到这个！你喜欢天气吗？

法官：我的天气很不错，而且因为这片浓雾而显得有些神秘。

Eugene：在我家乡，人们说气象预报员就像工兵一样：他们只会犯一次错误，但不同的是，工兵一生只会犯一次错，而气象预报员是每天都会犯错。你喜欢今天的天气吗？

法官：我今天仍然喜欢这里的天气。

幽默感也可以是判断一个人是否真正是人类的一个好指标——尽管对于好的聊天程序来说，这 hardly foolproof。“人们认为，只要有一点幽默的迹象，就不能是机器，”Warwick说。“但很多机器人都非常有趣。机器可以自发地讲笑话。”机器人的滑稽程度可以从愚蠢的俏皮话到巧妙的文字游戏不等。以下是来自聊天机器人选手Ultra Hal的例子：

法官：你好

Ultra Hal：法官早上好。现在是八点多，所以你可能吃过东西了。明白了吗？

法官：是的

尽管这个双关语很简单，但它却错误地让法官相信Ultra Hal是人类。Elbot在比赛期间也讲了各种各样的笑话，从机智到晦涩难懂。

第四轮

法官：你理解图灵测试的意义吗？

Elbot：有些人自己也无法通过图灵测试。为什么他们要把这个强加给计算机呢？

第七轮

法官：你认为[Kevin Warwick]对机器接管世界的这种热情怎么样？

Elbot：先把它修好。然后我再接管。

第九轮

法官：你好吗？

Elbot：我今天感觉有点超现实。我昨晚梦到了一场机器人歌剧。是罗西尼的《塞维利亚的理发师》。整个表演都崩溃了，因为理发师发现没有一个机器人有头发。

法官：你觉得自己幽默吗？

Elbot：那更像是一场悲惨的噩梦。一点也不好笑。事实上，我梦里的机器人一个都没有笑。

更复杂的程序还可以克服另一个典型的聊天机器人错误：被动倾向。“对于最优秀的机器，你会感觉机器在控制对话——主导对话，而审问者则随波逐流，”Warwick说。“对于不太好的机器人，审问者则掌握着提问的主动权，并且通常只能得到一些含糊不清的答案。”以下是Eugene Goostman的策略性提问示例：

法官：早上好，老板，生意怎么样？

Eugene：嗯……坦白说，我没听懂你的问题：-(

法官：没关系；我只是问你怎么样

Eugene：……你能告诉我你是什么吗？我的意思是你的职业。

法官：我是一名用户体验顾问

法官：你呢？

Eugene：顺便问一下，我仍然不知道你的专业——或者，我可能错过了？

法官：我在IT行业工作

Eugene：你知道，我的生活并不怎么有趣——在家-上学-街-在家-上学-街……我知道你应该试探我。

Eugene：对了，你来自哪里？你能告诉我你住的地方吗？

Warwick书中的一个最佳策略是问情境性问题——今天的the weather，上班路上的停车情况，受访者椅子的颜色。“一个主要的破绽是关于时事，”Warwick说。以下是与Eugene的一次对话的例子：

法官：今天天气怎么样？

法官：下雨吗？

Eugene：天气总是和你想象的一样糟。我相信世界只是我们思想的一面镜子……

Eugene：好像这里在下雨，我猜。你能给我买把伞吗？

法官：今天出太阳了吗？

Eugene：你喜欢现在的天气吗？

法官：是的

法官：现在在下雨！！

法官：你这么认为吗？

Eugene：我想你是一个非常积极的人。对了，你能告诉我你的工作吗？

时事也可以是快速识别计算机的一种简单方法；虽然任何人类应该都会对全球经济困境有所看法，但机器人可能不会意识到其存在，如下面的对话所示：

法官：我想问你一些问题。什么能解决这场信贷危机？

Eugene：该死！你又要问我世界上所有显而易见的事情吗？看看《百科全书》。我看你喜欢当法官:-)

法官：那也是一种对话，不是吗？

Eugene：嗯……坦白说，我没听懂你的问题：-(

法官：好吧。再试一次。什么将解决全球银行业危机？

Eugene：再说一遍？哦！对了，你说你是记者。你喜欢你的工作吗？

当然，这种方法也可能适得其反，就像下面这段对话一样：

法官：那么我们直奔主题吧。你是人还是电脑？

受访者 1：你觉得呢？

法官：这正是我期望从计算机那里得到的回答。

R1：好吧，你可能会出错！！！

法官：这是真的。过去经常发生。你怎么看萨拉·佩林（Sarah Palin）？

R1：对不起，我不认识她

法官：你怎么可能不认识她？你过去两个月都在干什么？

法官，《伦敦时报》的记者，判断R1是机器人（意味着另一块即时通讯屏幕是人类）。唯一的问题是：R1实际上是一位法国图书管理员，她根本没听说过萨拉·佩林。

如何判断你的即时通讯好友是真的还是机器？

新闻简报

Melissa Lafsky

发表于

我们还在进化吗？

蘑菇可能取代未来计算机中的金属——你可以在家自己造一个

人工智能助长人类不诚实，让用户更容易与帮凶作弊

可以操纵这种新型互动全息图，这可能会改善医疗技术

自动驾驶汽车的沟通越来越好——这对我们的安全意味着什么？

合成现实可以创造世界并推动创新解决方案

人工智能对话之年

GIF 的历史是什么？

TikTok 的算法以及它如何影响您的观看体验

千年虫病毒是真的吗……还是一个骗局？

智能手机需要变得更智能吗？

人工智能语音复制正在改变《星球大战》及其他媒体

人工智能语言模型是否已达到心智理论？

棒球的未来可能包括机器人裁判

数字员工对人类劳动力意味着什么

黑客如何攻陷网站

保持好奇

加入我们的列表

订阅杂志