广告

人类与电脑谁更聪明?第九回合:危险边缘

今晚,IBM的超级计算机正准备与“危险边缘”的冠军们一决高下。我们来盘点一下人类目前仍然能在哪些方面超越我们创造的计算设备。

Google NewsGoogle News Preferred Source
沃森在练习赛中面对它的人类对手。图片来源:危险边缘 / IBM

新闻简报

注册我们的电子邮件新闻简报,获取最新的科学新闻

注册

肯·詹宁斯和布拉德·鲁特习惯于在“危险边缘”的线索中快速闯关,让其他人感到压力。但今晚,两位最伟大的问答节目冠军将面对一个不会被吓倒的选手。

广告

是时候让世界认识沃森了。

IBM的玩“危险边缘”的计算机系统在家庭观众看来,是一个黑色屏幕上地球的化身。事实上,它是一个耗时多年构建的系统,也许是迄今为止最令人印象深刻的尝试,旨在创建一个能理解人类语言细微差别的问答计算机。

沃森没有连接互联网,但它的数据库里充满了书籍、脚本、词典以及首席研究员大卫·费鲁奇能够塞进的其他材料。存储信息是计算机的强项;“危险边缘”最大的人工智能挑战是词语的微妙之处。

今晚“危险边缘”的灯光亮起时,不会有人类操作员告诉沃森去它强大的数据库的哪个位置寻找答案。它必须解析每个线索和类别标题,以弄清楚被问的是什么。它必须快速浏览其数据库,找到相关的搜索词,并以高置信度选择正确的答案。它必须理解美国最受欢迎的问答节目中的双关语和古怪之处。它必须在抢答器前击败两位“危险边缘”冠军。而且,它也必须以问题的形式说出它的答案。

“危险边缘”是最具人性化的游戏之一——比IBM的深蓝在1990年代就已掌握的数学化、封闭式象棋系统要人性化得多。但“危险边缘”因此就是机器所面临的最大游戏挑战吗?波特兰州立大学的人工智能研究员和计算机科学教授巴特·马西说,并非如此。跳棋、象棋、拼字游戏、桥牌、西洋双陆棋、扑克、战棋等——软件设计师们都曾希望创造出能破解这些游戏的系统。但构建计算机玩游戏的历程,就是高估机器崛起和低估人脑实力的历程。沃森可能会在未来三天击败其全明星对手,但即使是今天,在许多我们最喜欢的游戏中——包括一些令人惊讶的游戏——计算机仍然落后于最优秀的人类玩家。

棋盘游戏:计算机称霸的领域

想象一下井字棋或四子棋的棋盘。它们小巧且是二维的;两位玩家轮流在棋盘上做标记,试图将三或四个标记连成一线,同时阻止对手这样做。这种优雅的简单性使得这些消遣成为了儿童游戏,随着玩家长大,他们会放弃这些游戏,转而追求更有趣的活动(无论是游戏还是其他)。这种设置也使得这些游戏非常适合计算机。

马西在他关于人工智能和游戏的笔记(pdf)中写道,井字棋中没有隐藏信息,也没有运气成分。玩井字棋的计算机掌握了必要时强制平局的技能,这与许多孩子在多次输棋后学会的技能一样。最重要的是,计算机可以做孩子做不到的事情:模拟所有可能的结果并选择完美的走法。因此,井字棋和四子棋属于“已解决”的游戏类别。计算机能完美地玩它们。你没有机会赢。

但是,当棋盘变得更大,规则变得更复杂时,会发生什么呢?事情就变得更棘手了。

下一页:计算机程序与跳棋、象棋以及古老围棋大师的对决。

广告

图片:iStockphoto | 空

升级为“王”

从井字棋跳跃到跳棋,难度陡增。它在8×8的棋盘上进行,而不是3×3的网格。棋子不是静止的标记,而是可以移动和相互作用的棋子。而计算挑战也大得多得多。

乔纳森·谢弗对此深有体会。这位阿尔伯塔大学的教授是一个研究团队的成员,该团队创造了一个扑克人工智能,能够在有限注德州扑克中击败人类玩家。但他一生的心血都倾注在跳棋上。

广告

1989年,谢弗开始创建一个程序来掌握这个游戏。早在深蓝与国际象棋大师加里·卡斯帕罗夫对弈之前,谢弗的Chinook程序就曾面对跳棋大师马里恩·廷斯利,廷斯利被一些人认为是史上最伟大的玩家。“从1950年到1992年,他参加了数千场比赛,”谢弗说,“而在重要的竞技比赛中,他总共只输了三场。”廷斯利在1992年赢得了他与机器的第一场比赛。到1994年他们再次相遇时,Chinook似乎已经准备就绪。他们进行了六场比赛,每次都打成平手。但廷斯利当时健康状况不佳;他退出了比赛,并于1995年去世。

谢弗自豪地回忆起这些与老大师的战斗,其中夹杂着遗憾和一丝恼怒:遗憾的是,岁月流逝,未能让升级后的Chinook完成与廷斯利的对决;恼怒的是那些对程序表现不屑一顾的人。要让反对者闭嘴,唯一的方法就是完美地玩跳棋,证明机器本可以在廷斯利巅峰时期击败他这个几乎完美的玩家。

现在没人再反对了。谢弗在2007年解决了跳棋。Chinook可以计算出每个可能位置的所有可能的走法序列。

如果你需要一个衡量跳棋复杂度的标准,请考虑一下:在第二次廷斯利对决(当时Chinook可以与谢弗描述的“人类所能想象的接近完美”的人抗衡并打成平手)和谢弗在游戏本身上取得巨大胜利之间,过去了13年。如果你需要另一个标准,那就是:跳棋中大约有5 x 10^20个可能的位置。在某个时刻,荒谬的巨大数字就只是荒谬的巨大数字。所以谢弗更喜欢的类比是:如果你抽干太平洋,这个数字就代表了重新灌满它所需的勺子数量。“如果你看看处理10^20个可能位置所需的计算量,这个计算在我有生之年是无法完成的。而我决心要活到看到最终结果的那一天。”

广告

因此,谢弗的团队寻找捷径。他们转向了更好的算法,以更快地分类这些位置,而不是等待下一代超级计算机的到来。这些新算法将Chinook需要检查的位置数量从10^20减少到10^14——这是一个巨大的差异,这使得谢弗在18年的艰苦努力后完成了这项工作。对于完美来说,等待的时间不算太长。

将军?

沃森不可避免地会让人联想到深蓝,那是IBM之前在游戏AI领域的一次高调尝试,是一款下棋程序。在许多方面,它们再不同不过了。沃森必须理解人类语言,而国际象棋则是用计算机的母语——数学和概率——写成的。

每种类型的国际象棋棋子都可以沿特定方向和距离移动,而跳棋只区分普通棋子和王棋。国际象棋的全部64个方格都可以使用,而跳棋只使用一半。因此,复杂性迅速累积。这是一场适合计算机的数字雪崩,1997年,深蓝在六局比赛中击败了俄罗斯国际象棋特级大师加里·卡斯帕罗夫。如果早在英特尔奔腾II和CD-RW首次上市时机器就战胜了人类,那么由2011年计算能力驱动的AI一定已经接近解决这个游戏了,对吗?

对吗?

广告

“绝对不是,”乔纳森·谢弗说,“现代技术根本无法解决国际象棋。即使你给我一百万台电脑,我每天24小时,每周7天使用它们,我也无法解决国际象棋。”

首先,人类,不要抱太高的希望:现代的国际象棋AI可以把你(还有深蓝)打得落花流水。但是国际象棋游戏嘲笑那些试图将其推向将死的程序员。谢弗说,科学家甚至不知道国际象棋中可能有多少种局面。它可能介于10^40到10^50之间。所以,至少,它比跳棋复杂100,000,000,000,000,000,000倍。

广告

面对这样的数据,人工智能专家巴特·马西说,即使是摩尔定律——计算能力随时间呈指数增长——也显得不足。

而国际象棋甚至还不是最棘手的棋盘游戏。想想围棋,这项可以追溯到中国古代的游戏,两位玩家轮流在19x19的棋盘交叉点上放置棋子,目的是包围对手的棋子并将其吃掉。棋盘所允许的惊人数量的可能走法,再加上需要提前很久制定策略,使得围棋多年来一直是程序员的目标。马西说,虽然国际象棋电脑在击败人类和达到完美之间徘徊,但围棋电脑甚至还没有接近人类的能力。他表示,就在最近,围棋电脑界取得了里程碑式的进展,在让九子的情况下击败了一位顶尖人类玩家

“一段时间内,不会有任何主流流行游戏被解决,”谢弗说,“这里存在一个差距。”

这还是轻描淡写。更像是一道鸿沟。

下一页:你能教会电脑虚张声势吗?

进入未知领域

不要跟伊默·萨茨谈论国际象棋。

广告
广告

“人们喜欢编程国际象棋有两个原因,”他说。“第一,它被人类假定为某种智力的黄金标准。其实不是,但人们就是这么认为的。第二,也是更重要的,国际象棋中总有一个客观正确的走法,因为所有信息都摆在那里。”萨茨说,人们可能对什么是正确的走法存在分歧——“但这只意味着有人对了,有人错了,或者他们都错了。”

萨茨本人下过很多国际象棋,但他不那么感动的态度来自于编程计算机玩一个更难的游戏:战略棋。而在战略棋中,没有“正确”的走法。

如果你从未玩过这款游戏,它看起来像国际象棋:两名玩家在方形棋盘上排兵布阵,相互对峙。他们进攻的目的是夺取能结束游戏的那一枚棋子——尽管在战略棋中,目标是夺取旗帜,而不是将王将死。

主要的相似之处就到此为止了。国际象棋是一本开放的书,它的中世纪棋子及其位置都是公开可见的。战略棋则充满了阴影。你看到对手移动了一枚棋子,但你不知道那枚棋子是什么。是最高级别的攻击者元帅?还是工兵,一枚用于解除玩家放置在旗帜周围炸弹的无防御棋子?唯一无需攻击就能辨别的方法是推断对手的心态,并试图解读他或她的策略。

由于计算机没有任何做人的经验,读心术并非其所长。萨茨在他的战略棋AI“探测器”中所做的,是将其编程为知晓人类倾向。它无法读懂你的扑克脸,但它知道人类在统计上最有可能虚张声势的场合;例如,它知道玩家经常用弱棋子积极行动以试图误导对手。它知道——通过观察人类玩游戏以及萨茨的教导——大多数玩家更喜欢在右侧而不是左侧保持力量(这可能是我们物种惯用右手的影响,这是计算机不具备的怪癖)。而且,最危险的是,它会记住你喜欢做什么以及如何布置棋子。“有些人已经和它玩了几千局,”萨茨说,“探测器能够记住这些对手使用的所有布局,这是毁灭性的强大信息。”

即便如此,Probe——在计算机对计算机的锦标赛中击败了其他战略棋AI——也只能与普通人类玩家的技能相匹敌。处理不完整信息的人工智能挑战太过巨大。

广告

我不能说谎。我能吗?

Probe 知道你何时最有可能虚张声势。但它不是一个演员。

“它自己虚张声势要困难得多,因为虚张声势就是撒谎,”萨茨说。“编程一台计算机去假装真的非常非常困难,也就是说,‘站起来,露出你的牙齿和獠牙,但看在上帝的份上,千万不要真的攻击,否则你会被杀死。’”

广告

在建立在不完全信息之上的游戏中,欺骗是核心。这在战略棋中是如此,当然,在扑克中也是如此。幸存的玩家是那些有点难以预测的人。“如果你是一个非常厌恶风险,从不冒险的人,你的对手会发现这一点,然后你就完了,”萨茨说。“如果你是那种无视所有风险的人,那么你也会死得很惨。”

那么,乔纳森·谢弗和阿尔伯塔大学的扑克人工智能团队是如何教会他们的扑克玩家说谎的呢?他们没有。

“在扑克中,这微不足道,”谢弗说,“你什么都不做。”

再说一遍?

广告

谢弗说,简单来说,他的团队并没有试图将任何心理学编程到程序中。当它玩的时候,它会计算出要做什么的概率分布,而这种可能的行动分布包括我们所说的虚张声势。机器不会将2和5的荒谬加注视为旨在吓跑其他玩家的“虚张声势”。它只是将2和5的加注视为其选项数组中的一个选择,并且它被编程为偶尔选择它——具体来说,是保持不可预测性而不输光所有钱的最佳次数。因此,谢弗不必编程机器去说谎。机器可以在不知道虚张声势或任何其他策略的心理学的情况下撒谎。“这些是人类对常见情景的称呼,”谢弗干巴巴地指出。

尽管如此,扑克程序并非赌博大师。阿尔伯塔大学的程序在有限注德州扑克中甚至能击败优秀的扑克玩家,因为下注受到限制。但当你去掉训练轮,玩无限注游戏时,人类就赢了。“这对游戏来说是一个重大的改变,”谢弗说,“而且人类更胜一筹。”

最后一页:拼字游戏、风险游戏和未来

文字问题

“危险边缘”的问题,简单来说,就是:沃森可以将其数据库塞入比肯·詹宁斯记忆的还要多的信息,但计算机却难以理解一个用普通英语提出的线索在问什么——这是孩子们不假思索就能做到的——而且对于许多“危险边缘”线索中涉及的文字游戏,它们更是困难重重。

广告

因此,问答机对人工智能构成了严峻挑战。我们每天都在努力告诉谷歌我们在寻找什么,这本身就是一场挣扎。试想一下,如果一台连接着全球知识的机器能够用普通的英语理解你的请求,结果会怎样:这就是为什么IBM在沃森亮相“危险边缘”之前,其广告一直赞扬其在医学、研究以及超越娱乐和游戏领域的革命性潜力。尽管如此,即使在“危险边缘”之前,游戏也一直在推动机器语言理解的发展。

马西说,十到十五年前,程序员面临的热门挑战是填字游戏。毕竟,他说,有无数种方法可以在棋盘上填入字母,但只有一种符合线索。而且,就像“危险边缘”的线索编写者一样,填字游戏线索编写者也喜欢双关语和蹩脚的笑话。

广告

但或许计算机玩的最有趣的文字游戏是拼字游戏。它之所以有趣,是因为它们并没有在比赛中完全击败所有人类。

拼字游戏的棋盘似乎为计算机的完美提供了一个完美的竞技场。毕竟,给AI一个词典很简单。根据眼前的棋盘和手中的字母牌,你可以想象它在几秒钟内就能选择出得分最高的走法,而它的人类竞争者却在心里苦苦思索正确的玩法。然而,马西解释说,拼字游戏远不止是一场词汇竞赛。

拼字游戏的残局——最后几回合,在最高水平的比赛中,胜负往往由此决定——是战术家而非语言学家的梦想战场。最优秀的拼字游戏选手不仅为自己得分,还会堵住可能对对手有利的字母。他们能做到这一点,是因为他们通过观察对手的玩法,对对手手中可能有的字母有了相当好的了解,并暗自思忖:“如果她有‘X’和‘Q’,她就会在那三倍得分格上玩‘quixotic’了。”马西指出,这是一种超越知晓所有单词的逻辑推理飞跃。此外,顶尖1%的拼字游戏冠军知道他们需要的所有单词。在任何一场比赛中,他们可能只会看到一两个以前不知道的单词。

别搞错了;电脑在拼字游戏方面很棒。但它们的技能(尚未)足以超越最优秀的玩家。

大规模多人崩溃

欺骗、直觉和语言掌控力赋予我们计算机无法企及的游戏优势。但我们还有一点优于它们:当玩家数量增多时,计算机就会变弱。

拼字游戏可以由几名玩家玩,“危险边缘”是三人游戏(尽管组织方式不同)。但大多数计算机程序员试图攻克的游戏都有一个共同点:它们都是一对一、两人、零和游戏,比如国际象棋。真正的多人游戏增加了许多变量,计算机难以处理。例如,谢弗的扑克系统在面对多于一个对手时表现不佳。

广告
广告

马西说还有很多例子:“风险游戏是另一个计算机根本玩不好的游戏,因为它是一个显著的多人游戏。在《危险边缘》中,你并不太担心战略方面的问题,你只是努力尽可能多地得分。你不能那样玩风险游戏。你不能只是试图尽可能多地占领国家。你不仅要考虑如何击败你的对手,还要考虑你的对手将如何相互作用。”

他们的技术可能已经征服了世界,但计算机尚未证明能够征服风险游戏的地图。

像我们一样思考?

没有人像谢弗、马西和萨茨这样的程序员和人工智能专家那样了解人类思维的力量——他们投入了无数时间试图匹配并超越人类的游戏能力,他们遇到了机器难以应付而人类轻而易举就能完成的欺骗等策略。在像战略棋这样发挥人类优势的游戏中,显而易见的解决方案可能是制造尽可能模拟人类思维的机器。

但萨茨不这么看。

“我有一个完全不同的看法:你永远不应该假设计算机程序应该与人类遵循相同的原理运作,”他说。“我认为将人类一直以来玩游戏的方式必然是最好的方式作为初始假设是无效的。”

这就是游戏电脑的力量。不仅仅是电脑每秒能进行比我们多得多的计算,记住比我们多得多的开局和残局,以及评估比我们多得多的可能选项。由于这些超人的数学能力,机器玩游戏的方式可能是人类玩家曾认为是错误的,或者根本从未考虑过的方式。

广告

因此,游戏电脑不仅仅是为了击败我们,它们还在教导我们。

“电脑不受人类先入为主观念的束缚,”谢弗说,“我们在国际象棋、跳棋、桥牌和西洋双陆棋中都看到了这一点。电脑革新了人类的玩法,因为电脑没有所有人类的包袱——我们被教导的偏见。它带着全新的视角来看待这些游戏。”

广告

保持好奇

加入我们的列表

订阅我们的每周科学更新

查看我们的 隐私政策

订阅杂志

订阅可享封面价高达六折优惠 《发现》杂志。

订阅
广告

1篇免费文章