广告

智能机器人仍遥不可及

顶尖人工智能研究人员解释了为什么制造出真正“智能”的人工智能如此困难。

Google NewsGoogle News Preferred Source
软件工程师罗伊·莱文在AI2西雅图总部的宽敞、反主流文化的办公室里工作。图片来源:Stuart Isett

新闻简报

注册我们的电子邮件新闻简报,获取最新的科学新闻

注册

在一个阴沉的九月天,坐落在西雅图璀璨灯光中的一家非营利组织,希望一次一台电脑地改变世界。它的研究人员希望改变机器感知世界的方式:让它们不仅能看到世界,还能理解它们所看到的一切。

广告

在艾伦人工智能研究所(AI2),研究人员正在做着这件事。AI2由微软的远见者保罗·艾伦于2014年创立,是美国最大的非营利人工智能研究机构。它的园区延伸到联合湖的北臂,与仓库和拥挤的码头共享水岸。湖对面,几十台起重机高耸于西雅图天际线之上——这是这座城市持续科技繁荣的视觉提醒。在AI2,不受追逐利润的董事会的束缚,其首席执行官奥伦·埃齐奥尼的使命很简单:直面人工智能研究中最宏大的挑战,服务于公共利益,利润可以不计。

AI2的办公室氛围与其反主流文化精神相符。埃齐奥尼亲手策划的语录墙就在乒乓球室外面。天花板到地板的白板和随机的玻璃表面上布满了方程式,就像涂鸦一样。员工们被鼓励划公司皮划艇休息。计算机科学家阿里·法哈迪可以从他民主选择的办公室窗户欣赏西雅图的天际线;研究人员投票决定他们的工作空间位置。我们就是在这里见面,探讨计算机视觉的极限。

在某个时刻,他将一支白板笔放在办公桌边缘,问道:“如果我把这支笔滚过边缘会发生什么?”

“它会掉到地上,”我回答道,心想法哈迪也许需要一次皮划艇休息。

狭义人工智能系统就像天才。它们非常擅长单一、明确的任务:例如,一台扫地机器人吸尘地板,或者一位数字象棋大师。但是,一台能识别猫图像的电脑却不能下棋。人类两者都能做到;我们拥有通用智能。AI2团队希望将这些计算机天才从它们孤独的任务中解脱出来,并播下常识的种子。“我们还有很长的路要走,”埃齐奥尼告诉我。

埃齐奥尼的20年愿景是建立一个能充当科学家学徒的人工智能系统。它将阅读并理解科学文献,连接研究之间的点,并提出可能带来重大突破的假设。当我问埃齐奥尼IBM的沃森是否已经在做这件事时,我感觉触到了他的痛处。“他们提出了一些非常强烈的说法,但我还在等待数据,”他说。

但这项崇高事业也有其阴暗面。如果我们变得依赖这些新兴技术,某些技能可能会变得过时。我不禁想:如果更智能的人工智能吞噬了更多人类驱动的任务,我们如何才能跟上它们呢?

这只是数学

垃圾摇滚在1980年代末和90年代在西雅图的Off Ramp和Vogue等俱乐部中兴起。肮脏的吉他连复段和充满焦虑的歌词是对当时主流音乐的巨大反抗——那些穿着氨纶、镶着亮片、发型夸张的重金属乐队在体育场里售罄。垃圾摇滚不是公司机器上的一个齿轮,伙计。

所谓的“西雅图之声”仍然在翡翠城的潮湿混凝土中回响。我在城市灰色的涂鸦中看到它,我在埃齐奥尼身上听到它。这位52岁的哈佛毕业生比库尔特·柯本笑得多,他更喜欢扣子衬衫而不是二手店的法兰绒格子衬衫。但在他友好的举止之下,有一种我们与世界对抗的边缘,一种渴望走出自己道路的愿望。AI2不像Facebook、Google或其他科技巨头,埃齐奥尼也不希望它是。当我们交谈时,他用AlphaGo的故事作为例子。

广告

“没错!显然它会掉下来。这太微不足道了,”他笑着说。“但这对机器来说仍然非常困难。”预测力对物体的影响——我瞬间就能做到——首先需要感知该物体;今天的计算机视觉系统在这方面表现出色。但估计物体未来的位置需要理解场景几何、物体属性、力的施加方式以及物理定律。计算机尚未达到这个水平。

如果这些是人工智能研究的前沿,那么我们预言已久的计算机霸主可能还要很长时间才能出现:总体而言,人工智能仍然相当“笨”。即使是今天的“智能”程序,也是由狭义或弱人工智能驱动的。强人工智能,也称为通用人工智能,尚不存在。

广告

2016年3月,谷歌研究人员在该领域取得了年度最辉煌的成就,他们的人工智能AlphaGo掌握了古老的中国围棋。由于棋盘组合数量惊人(大约是2后面跟着170个零),围棋被认为是计算机科学中的“白鲸”。在韩国与世界顶级围棋选手李世石备受瞩目的对决中,AlphaGo以4比1胜出。

AlphaGo很快被各种“标题党”新闻报道引用,称其是超级智能和《终结者》式末日的预兆,但埃齐奥尼对这些简单化的叙述持异议。“人工智能不是魔法。它是数学,”他叹了口气说。AlphaGo并非末日降临的迹象。它是深度学习的强大展示,由于对人工神经网络(ANNs)的重新关注,深度学习已成为人工智能研究的一个热门子领域。

聪明的电脑

人工神经网络(ANNs)是算法——一套规则——其灵感来源于研究人员认为人类大脑处理信息的方式。要理解它们的工作原理,最容易从1943年开始,当时神经生理学家沃伦·麦卡洛克和数学家沃尔特·皮茨用数学描述了动物大脑中神经元的功能。

麦卡洛克-皮茨神经模型是一个用于将一系列加权输入转换为二进制输出的方程。大量数据输入,然后输出0或1。将一堆数字加起来,如果结果大于或等于预设的总和,则输出为1。如果结果小于总和,则输出为0。这是对大脑中神经元工作方式的简化模拟:它们要么放电,要么不放电。

广告

几十年来,计算机科学家们在这个基础上不断发展,巧妙地调整模型神经元的数学逻辑,连接多个神经元并将它们组装成层次化、分层的网络——即人工神经网络(ANNs)。今天使用的许多人工神经网络实际上早在几十年前就已经被完整描述并理论上可执行了,但当时它们并没有那么有用。“人工智能的一夜成功经历了30年的酝酿,”埃齐奥尼说。

人工智能研究人员为特定任务配置人工神经网络,指定数据在其中流动的路径,以“教导”机器。例如,要让一个人工神经网络学习识别西雅图标志性太空针塔的图像,科学家可能会使用人工神经网络第一层中的神经元来计算单个像素的亮度。层次结构中其上方的层可能会专注于结构的形状。随着更多太空针塔图像通过网络输入,连接这些数字神经元的加权数学根据算法参数自动调整,从而加强太空针塔独有的连接,同时削弱其他连接。

这是AlphaGo胜利的秘密。它从数千场人类对弈的围棋比赛中提取制胜策略,通过人工神经网络进行处理。然后它自己对弈了数百万次,调整其网络以达到最佳围棋策略,不断改进。“这是一次巨大的成功,但这是一次狭隘的成功,需要一大群人多年的努力,”埃齐奥尼说。“AlphaGo甚至不能下象棋。它不能谈论比赛。我6岁的孩子都比AlphaGo聪明。”

AlphaGo并非个例。我们几乎所有互动的人工智能都可能笨得惊人。扫地机器人会自动学习你客厅的布局,但它仍然会碾过地毯上的狗屎,把房子变成一幅粪便味的杰克逊·波洛克画作。微软的聊天机器人Tay,被编程用来根据Twitter输入生成类似人类的对话,却在24小时内演变成一个粗口连篇的种族主义者。正如法哈迪所解释的,人工智能的有效性仅取决于其输入的数据。

广告

“数据是金钥匙,”法哈迪说。“一旦数据不足,就会给我们带来麻烦。”我们知道蝴蝶比大象小,但如果没人花时间写下来,机器就很难学会。如果一棵树倒在森林里却没有产生任何数据,那么就人工智能而言,这棵树从未存在过。

达到标准

与此同时,在法哈迪的办公室走廊尽头,AI2的高级研究经理彼得·克拉克采取了不同的学习方法。他强迫他的实验对象反复完成纽约州摄政王科学测试。如果不是施加在机器身上,这简直是残酷且不寻常的。

广告

“通过哪怕是四年级的科学测试也不是一个单一的任务。它是需要结合起来的一系列技能,”他说。2016年2月,AI2向全球数千名研究人员发出挑战,开发一种能够通过标准八年级科学测试的人工智能。最高奖项授予了以色列的Chaim Linhart,他的程序获得了59%的分数。

科学测试是通向常识性计算机的门户。考试需要特定的和一般的知识才能通过,克拉克可以通过评估计算机的表现轻松检查他的研究进展。测试包含图表、开放式问题、阅读理解问题等。

教授机器测试的一个方面——理解图表——让克拉克筋疲力尽,他需要建立一个包含5000个带注释图表和15000个多项选择题的新数据库。所有数据都经过逐键注释,阐明了关系和图表所表达的含义。只有这样,克拉克的团队才能设计和训练一个能够回答有关图表问题的系统。

在AI2创建的每一个新数据集——以及机器解析的每一个图表、视频或文本块——都在彼此的基础上得到改进,使埃齐奥尼的科学家学徒愿景更接近现实。最终,埃齐奥尼的团队将设计算法,而不是八年级科学测试图表,这些算法将解释高级科学论文中的图像、图表和文本,根据其知识形成新的联系和见解。目前,AI2的语义学者搜索引擎预示着未来;它是所有研究汇聚的基石项目。

语义学者并行使用多个ANNs,从研究中识别有价值的信息。它结合这些技能,不仅理解给定研究中传达的信息,还理解其与更大研究体系的相关性。“医学突破不应因搜索科学文献的繁琐过程而受阻,”埃齐奥尼说。AI2并非唯一一家构建人工智能增强型搜索引擎的机构,但再次强调,这仅仅是第一步。

这听起来很棒,我相信埃齐奥尼的意图是最好的,但我承认,很难不有点担心。《终结者》中预示的机器人末日可能不会(而且几乎肯定不会)发生,但更智能的机器并非完全没有风险。

广告
广告

一个糟糕的未来

在我离开AI2总部后,我走过西雅图市中心一座立交桥下的几顶破旧帐篷。其中一顶帐篷里伸出了两只脚。一个街区外,一个没有牙的男人语无伦次地对着四名警察大喊,警察恳求他站起来穿上鞋子。他做不到。他的衣服破烂不堪。这是否预示着未来,越来越多的人被机器抛弃,被那些比人类思维更出色、行动更迅速的机器取代?

“我们确实需要认真思考对就业的影响,”埃齐奥尼说。世界经济论坛去年的一项分析估计,到2020年,自动化和机器人将导致全球15个发达和新兴经济体中大约500万个工作岗位消失。在2016年对800名CEO进行的一项全球调查中,44%的人表示他们相信人工智能将使人们在未来的工作中“基本上无关紧要”。

并非所有预测都令人沮丧。奥巴马政府在2016年发布了一份报告,概述了一个普遍乐观的未来,其中人工智能将成为经济增长和社会进步的主要驱动力。当然,人工智能技术可能会取代低工资、受教育程度低的工人,但报告指出,政策制定者的职责是确保这些人“得到再培训,并能够在与……自动化互补的职业中取得成功”。IBM的首席创新官伯尼·梅耶森向我保证,人工智能技术不会取代我们——它们会让我们变得更好。他说,这些技术是资源;它们通过放大一个人已经做得最好的事情来发挥作用。我们拭目以待,看看悲观主义者还是乐观主义者更接近事实。

但是,日益依赖人工智能还存在另一个困难:这是一项彻头彻尾的人类事业。选择数据集中的内容或非内容,调整算法中的参数等等,都是主观的决定。西雅图垃圾摇滚乐队“爱丽丝囚徒”在他们最具标志性的歌曲之一《盒子里的男人》中以“我就是盒子里的男人/埋在我的垃圾里”开场。它提醒我们存在的混乱,成瘾,被我们不完美的污垢所掩埋。所有这些缺点都将反映在我们机器的设计中。“机器学习99%是人类学习,”埃齐奥尼说。

以深度学习软件为例,它如今广泛应用于法律系统。这些系统会生成风险评分,评估被告再次犯下暴力罪行的可能性。独立新闻非营利组织ProPublica调查了佛罗里达州布劳沃德县的7000名被捕者,发现该特定系统(名为COMPAS)标记为高风险的人中,只有20%后来犯下了另一起暴力罪行。其他问题包括:COMPAS将黑人被告标记为再犯的几率是白人被告的两倍,并且它错误地将后来犯下更多罪行的白人被告标记为低风险。算法的设计方式以及程序员选择输入的数据都影响了这些结果。

埃齐奥尼对这些伦理困境有一个理论上的解决方案:守护者人工智能。它将利用深度学习技术来监控其他从事社会重要任务的人工智能,例如批准贷款或评估犯罪行为。“守护者人工智能将拥有无限的注意力,不知疲倦的耐心,并且能够跟上。”它可以确保另一个人工智能不会脱轨。

广告

但谁来编程守护者人工智能呢?不完美的人类。人工智能研究很快就涉及到哲学、伦理和精神层面的问题。研究人员已经在努力解决这些问题,但没有简单的答案。

一个结局,或一个新的开始

离AI2不远的地方是西雅图标志性的煤气厂公园。它的主要特色是一座几十年前为这座城市提供燃料的老工厂的生锈内部。为了欣赏绝佳的天际线景色,你可以爬上大土丘的蜿蜒小径,那是一堆旧工厂的瓦砾,现在覆盖着泥土和草地。傍晚时分,当太阳低垂时,我站在土丘顶部,在我庞大的机器上投下15英尺长的影子。

广告

凝视着我的影子在休眠的管道和桶上舞动,我 wondering 我有生之年是否会与这件工业文物共享同样的命运。人工智能已经在撰写体育赛事总结和财经新闻。它们转向科学新闻只是时间问题吗?不完美编程的机器是否会在我不知情的情况下影响我的生活?

但傍晚完美无瑕。云层散去,天空晴朗——在这座城市是一种奢侈。此刻,我享受着落日余晖。


我们的人工智能联想

研究人员分析了《纽约时报》关于人工智能报道中的热门关键词,展示了公众与这项技术不断发展中的关系。

1986-1989 伽利略项目、语音、自动化、言语、不明飞行物、太空武器、打捞、心理学、宇航员

广告

1990-1994 但丁二号、科幻小说、手写、火山、卫星、翻译、地图、超级计算机、激光、太空平台

1995-1999 遥控系统、象棋、哈勃望远镜、空间站、海洋、小型化、火星、电脑游戏

2000-2004 无人机、吸尘器、纳米技术、军用车辆、赛格威、玩偶、虚拟现实、长寿、彗星、DNA

2005-2009 语音识别系统、搜索引擎、游戏、太阳系、紧急医疗、GPS、交通

广告

2010-2015 无人驾驶汽车、同理心、初创企业、计算机视觉、量子计算、云计算、末日、假肢、电子学习 来源:《人工智能公众认知长期趋势》,人工智能促进协会,2016年12月。

保持好奇

加入我们的列表

订阅我们的每周科学更新

查看我们的 隐私政策

订阅杂志

订阅可享封面价高达六折优惠 《发现》杂志。

订阅
广告

1篇免费文章