广告

如何判断你的即时通讯好友是真的还是机器?

提示:问它关于萨拉·佩林(Sarah Palin)的事情。

Google NewsGoogle News Preferred Source

新闻简报

注册我们的电子邮件新闻简报,获取最新的科学新闻

注册

每年一次,一群计算机科学家和技术专家聚集在卢布纳奖(Loebner Prize)竞赛中,以测试人工智能的持续发展。这项比赛是计算机科学大师艾伦·图灵(Alan Turing)在20世纪50年代提出的著名“图灵测试”的现实演绎:一名人类同时与另一个人和一个机器进行电子对话。如果评委无法区分人与计算机,那么机器就通过了。

广告

比赛的年度获胜者将获得2000美元奖金和一枚铜牌。10万美元的最高奖和一枚金牌从未被颁发过,它仍然保留给第一个回应完全无法与人类区分的计算机——第一台真正能“思考”的计算机(至少根据图灵的定义)。

去年的评委——一群记者、计算机科学家、哲学教授和其他学者——每人都坐在一台屏幕从中分开的电脑前,两侧各有一个聊天窗口。评委们被告知,一边是与一个机器人聊天,另一边是与一个人聊天。

一等奖被授予了Elbot,它是Fred Roberts和Artificial Solutions的智慧结晶。Artificial Solutions是一家为宜家(Ikea)和挪威电信公司(Telenor)等企业创建客服机器人的公司。这台机器欺骗了25%的评委。二等奖被授予了Eugene Goostman,这是由东欧团队Vladimir Veselov、Eugene Demchenko和Sergey Ulasen创建的一个机器人。它欺骗了大约10%的评委。

那么,根据最新的测试,有哪些确凿的方法可以识别出机器人?我们请卢布纳奖组织者、计算机科学专家兼英国雷丁大学(Reading University)控制论系主任Kevin Warwick分享他的最佳建议。

识别机器人的最快捷简单的方法之一是测试聊天者的中期记忆。虽然人类很可能会记住你三分钟前问的“苹果是什么颜色的?”这个问题,但机器人可能不会,所以第二次问同一个问题会得到相同的答案。反之亦然:计算机更有可能重复问同一个问题。以下是亚军Eugene Goostman在中期记忆方面失误的例子:

法官:早上好,你好吗?

Eugene:你好!我今天心情很好。你呢?

法官:我感觉不错,谢谢。你今早吃早餐了吗?

Eugene:很高兴听到这个!你喜欢天气吗?

广告

法官:我的天气很不错,而且因为这片浓雾而显得有些神秘。

Eugene:在我家乡,人们说气象预报员就像工兵一样:他们只会犯一次错误,但不同的是,工兵一生只会犯一次错,而气象预报员是每天都会犯错。你喜欢今天的天气吗?

广告

法官:我今天仍然喜欢这里的天气。

幽默感也可以是判断一个人是否真正是人类的一个好指标——尽管对于好的聊天程序来说,这 hardly foolproof。“人们认为,只要有一点幽默的迹象,就不能是机器,”Warwick说。“但很多机器人都非常有趣。机器可以自发地讲笑话。”机器人的滑稽程度可以从愚蠢的俏皮话到巧妙的文字游戏不等。以下是来自聊天机器人选手Ultra Hal的例子:

法官:你好

Ultra Hal:法官早上好。现在是八点多,所以你可能吃过东西了。明白了吗?

广告

法官:是的

尽管这个双关语很简单,但它却错误地让法官相信Ultra Hal是人类。Elbot在比赛期间也讲了各种各样的笑话,从机智到晦涩难懂。

第四轮

法官:你理解图灵测试的意义吗?

广告

Elbot:有些人自己也无法通过图灵测试。为什么他们要把这个强加给计算机呢?

第七轮

广告

法官:你认为[Kevin Warwick]对机器接管世界的这种热情怎么样?

Elbot:先把它修好。然后我再接管。

第九轮

法官:你好吗?

Elbot:我今天感觉有点超现实。我昨晚梦到了一场机器人歌剧。是罗西尼的《塞维利亚的理发师》。整个表演都崩溃了,因为理发师发现没有一个机器人有头发。

法官:你觉得自己幽默吗?

广告
广告

Elbot:那更像是一场悲惨的噩梦。一点也不好笑。事实上,我梦里的机器人一个都没有笑。

更复杂的程序还可以克服另一个典型的聊天机器人错误:被动倾向。“对于最优秀的机器,你会感觉机器在控制对话——主导对话,而审问者则随波逐流,”Warwick说。“对于不太好的机器人,审问者则掌握着提问的主动权,并且通常只能得到一些含糊不清的答案。”以下是Eugene Goostman的策略性提问示例:

法官:早上好,老板,生意怎么样?

Eugene:嗯……坦白说,我没听懂你的问题:-(

法官:没关系;我只是问你怎么样

Eugene:……你能告诉我你是什么吗?我的意思是你的职业。

广告

法官:我是一名用户体验顾问

法官:你呢?

广告

Eugene:顺便问一下,我仍然不知道你的专业——或者,我可能错过了?

法官:我在IT行业工作

Eugene:你知道,我的生活并不怎么有趣——在家-上学-街-在家-上学-街……我知道你应该试探我。

Eugene:对了,你来自哪里?你能告诉我你住的地方吗?

广告

Warwick书中的一个最佳策略是问情境性问题——今天的the weather,上班路上的停车情况,受访者椅子的颜色。“一个主要的破绽是关于时事,”Warwick说。以下是与Eugene的一次对话的例子:

法官:今天天气怎么样?

法官:下雨吗?

Eugene:天气总是和你想象的一样糟。我相信世界只是我们思想的一面镜子……

广告

Eugene:好像这里在下雨,我猜。你能给我买把伞吗?

法官:今天出太阳了吗?

广告

Eugene:你喜欢现在的天气吗?

法官:是的

法官:现在在下雨!!

法官:你这么认为吗?

Eugene:我想你是一个非常积极的人。对了,你能告诉我你的工作吗?

时事也可以是快速识别计算机的一种简单方法;虽然任何人类应该都会对全球经济困境有所看法,但机器人可能不会意识到其存在,如下面的对话所示:

广告
广告

法官:我想问你一些问题。什么能解决这场信贷危机?

Eugene:该死!你又要问我世界上所有显而易见的事情吗?看看《百科全书》。我看你喜欢当法官:-)

法官:那也是一种对话,不是吗?

Eugene:嗯……坦白说,我没听懂你的问题:-(

法官:好吧。再试一次。什么将解决全球银行业危机?

Eugene:再说一遍?哦!对了,你说你是记者。你喜欢你的工作吗?

广告

当然,这种方法也可能适得其反,就像下面这段对话一样:

法官:那么我们直奔主题吧。你是人还是电脑?

广告

受访者 1:你觉得呢?

法官:这正是我期望从计算机那里得到的回答。

R1:好吧,你可能会出错!!!

法官:这是真的。过去经常发生。你怎么看萨拉·佩林(Sarah Palin)?

广告

R1:对不起,我不认识她

法官:你怎么可能不认识她?你过去两个月都在干什么?

法官,《伦敦时报》的记者,判断R1是机器人(意味着另一块即时通讯屏幕是人类)。唯一的问题是:R1实际上是一位法国图书管理员,她根本没听说过萨拉·佩林。

保持好奇

加入我们的列表

订阅我们的每周科学更新

查看我们的 隐私政策

订阅杂志

订阅可享封面价高达六折优惠 《发现》杂志。

订阅
广告

1篇免费文章