17岁的达门德拉·莫德哈收到将改变他一生的消息那天,他正在孟买当地一家医院监督一群工人刮铁椅上的油漆。他对这份工作感到满意,它提供了稳定的收入和安全感——这在1986年是孟买贫困少年最现实的抱负。
午饭后不久,莫德哈的母亲派人到工地传话:全邦大学入学考试成绩已经公布。家里收到一封令人费解的电报,似乎出了某种错误。
莫德哈的成绩不仅在孟买这座印度人口最稠密的城市名列前茅,而且在马哈拉施特拉邦(人口1亿)的数学、物理和化学考试中都获得了第一名。他能去学校处理一下吗?
当时,莫德哈无法想象那封电报会给他的未来带来什么。他的父母都在11年级后结束了学业。他能数得出的上大学的亲戚屈指可数。
但自从这些考试成绩为他铺平了通往印度最负盛名的技术学院之一的道路,以及在加利福尼亚州圣何塞IBM阿尔马登研究中心成功的计算机科学职业生涯以来,莫德哈的抱负已经大大扩展。
最近,这位矮小的工程师,浓密的黑眉毛,短发和眼镜,坐在他的硅谷办公室里,分享了一个不亚于改变计算未来的愿景。“我们的使命很明确,”现年44岁的莫德哈说,他举起一块带有金色方块的矩形电路板。
“我们希望这些芯片无处不在——在每个角落,在万物之中。我们希望它们成为世界绝对不可或缺的一部分。”
传统芯片是微型电气元件在一小块板上的集合,用于计算机执行操作。它们通常由数百万个微小电路组成,这些电路能够编码和存储信息,同时执行编程指令。
莫德哈的芯片也做同样的事情,但能源节省如此巨大,以至于它们所组成的计算机将能够处理更多的数据,这是设计使然。莫德哈设想了一种以新芯片为关键的新型计算范式,其能力远超当今任何现有技术,其模型正是让孟买一位贫困工人能够跻身技术创新伟大殿堂的同一神奇实体:人脑。
转向神经科学
人脑消耗的能量大约相当于一个20瓦的灯泡——比模拟大脑般计算的计算机少十亿倍。它如此紧凑,可以装进一个两升的汽水瓶。然而,这团有机物质可以做到现代计算机无法做到的事情。
当然,计算机在执行预编程计算方面要优越得多——比如计算工资或计算登月舱到达月球特定位置所需的路线。但即使是最先进的计算机也无法与大脑理解陌生景象、声音、气味和事件,并迅速理解它们之间关系的能力相媲美。
这些机器也无法与人脑从经验中学习并根据记忆进行预测的能力相提并论。
五年前,莫德哈得出结论,如果世界上最优秀的工程师在数十年的尝试旧方法后,仍然没有找到如何匹配大脑的能源效率和创造力的方法,那么他们可能永远也做不到。
于是,他抛弃了过去60年来指导芯片设计和软件开发的许多原则,转而研究神经科学文献。也许理解大脑的不同组成部分及其相互配合的方式将有助于他构建一个更智能、更节能的硅机器。
这些努力正在见效。莫德哈的新芯片包含的硅组件粗略地模拟了微观碳基脑细胞的物理布局和连接。莫德哈确信,他的芯片可以用来构建一个人类大脑规模的认知计算系统,而功耗仅为其100倍,使其比当今的计算机节能1000万倍。
莫德哈的团队已经展示了一些基本能力。在没有程序员明确告知如何操作的情况下,他们开发的芯片可以学习玩《Pong》游戏,在屏幕底部移动一个横条并预测弹跳球的精确角度。它们还可以识别出实验助手用电子笔在平板上潦草写下的0到9的数字。
当然,许多工程师都取得了这样的成就——甚至更令人印象深刻的成就。一个被称为机器学习的子专业致力于构建算法,使计算机能够根据经验发展新的行为。这些机器已经在国际象棋和《Jeopardy!》中击败了世界上最聪明的人。
但是,虽然机器学习理论家在教计算机在严格的参数集内执行特定任务方面取得了进展——例如如何平行泊车或在百科全书中寻找琐事问题的答案——他们的程序并不能让计算机以开放式的方式进行泛化。
莫德哈希望他节能的芯片能带来改变。“现代计算机最初是为三个基本问题设计的:商业应用,如账单;科学,如核物理模拟;以及政府项目,如社会保障,”莫德哈说。
另一方面,大脑是在进化的熔炉中锻造出来的,旨在迅速理解周围的世界并根据其结论采取行动。“它有能力在巨大的草丛中,在巨大的噪音中,识别出潜伏的捕食者,而无需被告知它正在寻找什么。它没有被编程。它学会了逃避和躲避狮子。”
具有类似能力的机器可以帮助解决人类最紧迫的问题之一:信息过载。2005年至2012年间,全球创建、复制和消费的数字信息量增长了2000%以上——2012年超过2.8万亿千兆字节。
据估计,这几乎与可观测宇宙中的恒星数量一样多。编写代码来指导今天的计算机理解这股信息洪流——如何排序、分析、连接、如何处理——这项艰巨的任务已经远远超出了人类程序员的能力。
莫德哈认为,认知计算机可以弥补这一差距。像大脑一样,它们将整合来自多个感官流的输入,形成联想,编码记忆,识别模式,做出预测,然后解释,甚至可能行动——所有这些都比今天的机器消耗更少的电力。
例如,通过整合来自监测世界水资源的众多传感器的数据流,计算机可能学会识别压力、温度、波浪大小和潮汐的变化,然后发出海啸警报,尽管目前的科学尚未确定与这些巨浪相关的变量群。
基于大脑的计算机可以帮助急诊医生做出难以捉摸的诊断,即使科学尚未识别出与潜在疾病相关的体温、血液成分或其他变量的变化集合。
“您仍然希望将您的工资、性别、社会安全号码存储在今天的计算机中,”莫德哈说。“但认知计算为我们提供了一种激进不同类型机器的补充范式。”
点亮网络
莫德哈绝不是第一个从大脑中汲取灵感的工程师。整个计算机科学领域都是从大脑最小单元——被称为神经元的细胞——执行计算的方式中获得的见解发展而来的。
正是神经元的放电使我们能够思考、感受和移动。然而,这些能力并非源于单个神经元的活动,而是源于相互连接的神经元网络发送和接收简单信号并协同工作。
类脑机器的潜力早在1943年就已显现,当时神经生理学家沃伦·麦卡洛克和数学家沃尔特·皮茨提出了一种理想化的数学公式,描述了神经元网络如何相互作用以引起彼此放电,从而在大脑中传递信息。
在生物大脑中,神经元通过被称为突触的连接点传递电化学信号进行交流。这个过程通常始于外部刺激,如光线或声音。如果刺激足够强烈,接收神经元膜上的电压会超过给定阈值,这会发出神经化学物质飞过突触的信号,导致更多的神经元放电,依此类推。
当足够多的神经元协同放电时,输入就会被大脑的认知区域感知到。有足够的神经元一起放电,孩子就可以学会骑自行车,老鼠就可以掌握迷宫。
麦卡洛克和皮茨指出,无论他们的理想化神经元可能接收多少输入,它总是处于两种可能状态之一——激活或静止,这取决于是否超过了兴奋阈值。
由于神经元遵循“全或无定律”,大脑执行的每个计算都可以简化为一系列真或假表达式,其中真和假分别可以用1和0表示。现代计算机也基于使用1和0的逻辑系统,信息来自电开关而不是外部环境。
麦卡洛克和皮茨抓住了大脑和计算机之间的一个基本相似点。如果拥有提出足够多是或否问题的能力,两者大概最终都能解决即使是最复杂的问题。
举个例子,为了在红点和蓝点之间划定界限,人们可能会问每个点是红色(是/否)还是蓝色(是/否)。然后,人们可能会问相邻的两对点颜色是否不同(是/否)。通过足够多的问题和答案层级,人们几乎可以回答任何复杂的复杂问题。
然而,这种逻辑能力似乎与由神经元网络构成的大脑编码记忆或学习的能力相去甚远。这种能力在1949年由加拿大心理学家唐纳德·赫布解释,他假设当两个神经元紧密相继放电时,它们之间的连接会加强。“共同放电的神经元会共同连接”是他的关键工作中所产生的 catchy 词语。
神经元之间的连接解释了叙事记忆的形成。在一个著名的文学例子中,马塞尔·普鲁斯特在将玛德琳蛋糕蘸入茶中并咬了一口时,他的童年记忆如潮水般涌来。这个仪式是他在童年时期经常进行的。多年后他再次重复时,这些味觉和运动记忆存储在大脑区域的神经元放电了。
正如赫布所暗示的,这些神经元与存储其他童年记忆的神经元有着牢固的物理连接。因此,当普鲁斯特品尝玛德琳蛋糕时,编码这些记忆的神经元也放电了——普鲁斯特被如此多的联想记忆淹没,以至于他创作了多卷杰作《追忆逝水年华》。

达门德拉·莫德哈和团队成员比尔·里斯克站在IBM阿尔马登工厂的超级计算机旁。该团队利用阿尔马登和劳伦斯·利弗莫尔国家实验室的超级计算机,粗略模拟了小鼠、大鼠、猫和人类的大脑网络。| 马杰德·阿博法兹利
到1960年,计算机研究人员开始尝试模拟赫布关于学习和记忆的理念。其中一项成果是一个粗糙的大脑模型,称为感知器。感知器包含一个人造神经元网络,可以在计算机上模拟,也可以用两层电路物理构建。
据说层与层之间的空间代表突触。当各层通过突触传递信号进行通信时,据说这(大致)模拟了一个活的神经网络。人们可以调整两层之间传递的信号强度——从而调整第一层激活第二层的可能性(就像一个放电的神经元激活另一个神经元来传递信号一样)。
当第二层被指示对某些输入比其他输入更强烈地响应时,感知器学习就发生了。程序员训练一个人工神经网络“阅读”,当显示描绘字母表中某些字母的光模式时,它会更强烈地激活,而当显示其他模式时,它会较弱地激活。
能够训练计算机根据经验对数据进行分类的想法是革命性的。但是感知器是有限的:它仅由两层组成,只能识别“线性可分离”模式,例如可以用一条直线分隔的黑点和白点图(或者,更形象地说,一只猫坐在椅子旁边)。但是,如果给它看一个描绘更复杂事物(例如一只猫坐在椅子上)的黑白点图,它就会完全混乱。
直到20世纪80年代,工程师才开发出一种能够将神经网络提升到新水平的算法。现在,程序员不仅可以调整两层人工神经元之间的权重,还可以调整第三层、第四层,甚至第九层之间的权重,这代表了一个可以容纳更多细节的宇宙。
这扩大了此类网络可以回答问题的复杂性。突然,神经网络可以在黑点和白点之间绘制弯曲的线条,同时识别猫和它所坐的椅子。
来自孟买
正当神经网络复兴如火如荼之际,莫德哈进入了印度顶尖的工程学府——孟买印度理工学院。他于1990年毕业,获得计算机科学与工程学位。
当莫德哈寻求继续深造时,很少有领域像重新焕发活力的神经网络领域那样炙手可热。理论上,神经网络的规模只受限于计算机的规模和程序员的独创性。
在当时新功能的一个有力例子中,卡内基梅隆大学研究生迪安·波默洛使用模拟的路况图像来训练一个神经网络,以解释由连接到汽车车载电脑的摄像头捕捉到的实时路况图像。传统的程序员一直感到困惑,因为即使是角度、光线或其他变量的细微变化也会使预编程的软件偏离,这些软件被编码为识别精确的视觉参数。
波默洛没有尝试精确地编码每种可能的图像或路况,而是简单地向神经网络展示了不同种类的路况。一旦它被训练在特定条件下驾驶,它就能够泛化到在相似但不完全相同的条件下驾驶。
利用这种方法,计算机可以根据与没有分隔线的道路的相似性识别带有金属分隔线的道路,或者根据与晴天道路的相似性识别雨天道路——这在传统编码技术中是不可能实现的。在看到各种左转和右转道路的图像后,它可以识别任何角度的弯曲道路。
其他程序员设计了一个神经网络,通过将其暴露于良好和欺诈性信用卡账户的购买历史,来检测信用卡欺诈。根据已知欺诈账户中发现的一般消费模式,该神经网络能够识别行为并标记新的欺诈案件。
神经网络的圣地是圣地亚哥——1987年,约1500人聚集在那里,参加了二十年来第一次重要的神经网络会议。1991年,莫德哈来到加州大学圣地亚哥分校攻读博士学位。他专注于应用数学,构建方程来研究某些系统可以处理多少维度的变量,并设计配置来处理更多变量。
到1997年莫德哈被IBM在圣何塞雇佣时,另一个计算趋势正在占据主导地位:万维网的爆炸式增长。即使在那时,新数据的洪流压倒程序员的趋势已经很明显。互联网提供了关于人类行为、消费者偏好和社会趋势的巨大信息宝库。
但信息量如此庞大:如何组织它?如何才能从成千上万个特征进行分类的文件中找出模式?
当前的计算机消耗的能量实在太多,无法处理数据或应对所有突发事件所需的大规模程序。随着越来越多的传感器在家庭、桥梁、医院急诊室以及其他所有地方收集视觉、听觉和其他信息,信息洪流只会不断增加。
一条规范路径
莫德哈越思考,就越坚信解决方案可能在于回归大脑,这个现存最有效、最节能的模式识别机器。他从神经科学文献中寻找灵感,发现了麻省理工学院神经科学家姆里甘卡·苏尔的著作。
苏尔切断了新生雪貂眼睛与大脑视觉皮层相连的神经元;然后他将这些相同的神经元重新连接到听觉皮层。即使眼睛连接到大脑的声音处理区域,这些重新布线的动物成年后仍然能够看到东西。
对莫德哈来说,这揭示了一个引人入胜的洞察:苏尔的雪貂中的神经回路是灵活的——看起来就像某些汽车的前后轮胎一样可以互换。苏尔的工作暗示,要在计算机上构建人工皮层,你只需要一个设计来创建形成其所有构建块的神经元“电路”。
如果你能破解这个电路的密码——并将其体现在计算中——你所要做的就是重复它。程序员不必每次想给计算机添加新功能时都从头开始,使用模式识别算法来理解新的数据流。他们只需添加更多的电路。
“这种方法的全部美妙之处在于,”莫德哈热情地解释道,“如果你把哺乳动物的大脑皮层看作一张路线图,你会发现通过增加越来越多的这种电路,你将获得越来越多的功能。”
在寻找一种主要的神经网络模式时,莫德哈发现欧洲研究人员已经提出了一种数学描述,这种描述似乎与苏尔在雪貂中研究的电路相同,但这次是在猫身上。
如果你展开猫皮层并将其抚平,你会发现相同的六层重复出现。当不同层中不同组神经元之间建立连接时,得到的图表看起来非常像电路图。
莫德哈和他的团队开始编程一个受这些典型电路启发并可多次复制的人工神经网络。第一步是确定他们可以同时将多少个这样的虚拟电路连接起来并在IBM的传统超级计算机上运行。
有可能达到人类皮层的规模吗?
起初,莫德哈和他的团队在达到小鼠大脑皮层神经元数量的40%(大约800万个神经元,每个有6300个突触连接)之前就碰壁了。截断的电路限制了他们模拟所能达到的学习、记忆和创造性智能。
于是他们重新转向神经科学寻找解决方案。他们意识到,大脑中的实际神经元只有在被激活时才会成为器官整体计算过程中的一个因素。当不活跃时,神经元只是坐在一旁,消耗很少的能量,什么也不做。因此,没有必要每秒更新800万个神经元之间的关系1000次。这样做只会减慢系统速度。
相反,他们可以通过指示计算机只关注最近放电并因此最有可能再次放电的神经元来模拟大脑。通过这种调整,超级计算机模拟基于大脑的系统的速度提高了一千倍。到2007年11月,莫德哈已经模拟了一个鼠皮层规模的神经网络,拥有5500万个神经元和4420亿个突触。
两年后,他的团队将其规模扩大到猫脑的大小,模拟了16亿个神经元和近9万亿个突触。最终,他们将模型规模扩大到模拟一个拥有5300亿个神经元和100万亿个突触的系统,这是对人脑的粗略近似。
构建硅脑
研究人员已经模拟了数亿次那种典型的电路,这种电路有一天可能会催生一种新型认知计算机。但这只是一个模型,在旧机器上以令人发狂的慢速运行,这些机器永远不可能像大脑一样,永远无法胜任认知工作。
2008年,联邦国防高级研究计划局(DARPA)宣布了一项旨在构建实际认知计算机硬件的计划。第一笔拨款是创建一个节能芯片,它将成为新机器的心脏和灵魂——这对于莫德哈来说是梦想成真。
在 DARPA 的资助下,Modha 于 2011 年夏天推出了他的新型节能神经芯片。芯片成功的关键在于其处理器,即接收和执行机器指令的芯片组件。传统计算机包含少量非常快的处理器(现代笔记本电脑通常在单个芯片上有两到四个处理器),它们几乎总是在工作。每毫秒,这些处理器扫描数百万个电开关,监控并翻转数千个电路在两种可能状态之间:1 和 0——激活或未激活。
为了存储1和0的模式,今天的计算机使用独立的内存单元。电信号通过一条称为内存总线的路径在处理器和内存之间传输。工程师通过缩短总线长度来提高计算速度。
一些服务器现在可以每秒在内存和处理器之间循环数亿次。但是即使是最短的总线也会消耗能量并产生热量,需要大量的电力来冷却。
大脑的架构从根本上是不同的,基于大脑的计算机将反映这一点。大脑不是少数大型、强大处理器连续工作,而是包含数十亿个相对缓慢、微小的处理器——它的神经元——它们只在激活时才消耗电力。而且由于大脑将记忆存储在神经元之间的连接强度中,即在神经网络内部,因此它不需要耗能的总线。
莫德哈新芯片中的处理器是计算机中像大脑一样工作的最小单位:每个芯片包含256个非常慢的处理器,每个处理器代表一个人造神经元(相比之下,一种蛔虫的大脑大约有300个神经元)。在任何时候,只有被激活的处理器才消耗大量电力,从而降低了能耗。
但即使被激活,这些处理器所需的能量也远低于传统计算机中的同类产品,因为它们设计执行的任务要简单得多:传统计算机处理器负责执行所有计算和操作以使计算机运行,而莫德哈的微型单元只需要汇总从其他虚拟神经元接收到的信号数量,评估它们的相对权重,并确定是否有足够的信号来促使处理器发出自己的信号。
莫德哈尚未将他的新芯片及其处理器连接成一个模仿大脑物理布局的大规模网络。但他相信,一旦这样做,其益处将是巨大的。进化赋予大脑解剖结构卓越的能量效率,通过将最有可能进行交流的区域彼此靠近;神经元彼此越近,它们推动信号所需的能量就越少。通过复制大脑的宏观布局,莫德哈希望在他的受大脑启发机器中捕捉到这些以及其他意想不到的节能效果。
他花了数年时间研究猕猴大脑中长距离连接的研究,最终绘制出了一张包含383个不同大脑区域、由6602个独立连接组成的地图。这张地图表明了应该为任何人工大脑的不同区域分配多少认知计算芯片,以及它们应该连接到哪些其他芯片。
例如,大脑主视觉中心有336个连接。令人印象深刻的是,额叶有1648个连接,其中包含前额叶皮层,这是一个位于中央的大脑结构,是决策和认知思维的所在地。与活体大脑一样,神经计算机的大部分连接会汇聚到中央点。
当然,即使莫德哈能制造出这个“天才”,也有人质疑它是否会有任何用处。杰夫·辛顿,一位顶尖的神经网络理论家,认为如果没有适当的“学习算法”来阐明哪些因素会改变突触连接的强度以及改变多少,硬件就是无用的。他认为,建造一种没有这种算法的新型芯片,“有点像制造汽车发动机,却不先弄清楚如何制造爆炸并利用能量让车轮转动。”
但莫德哈和他的团队并未气馁。他们认为,他们正在用类认知计算能力补充传统计算机,从而节省大量能源,使容量突飞猛进地增长。这种需求日益紧迫。到2020年,全球将产生比2012年多14倍的数字信息。莫德哈说,只有当计算机能够自行发现模式并建立联系时,问题才能得到解决。
创造未来的计算机是一项艰巨的挑战。但莫德哈很久以前,在世界另一端还是个少年,刮着椅子上的油漆时,就已经明白,如果你能发挥人脑的力量,你所能做的事情是不可估量的。
[本文最初以“机器中的思想”的形式刊登。]
莫德哈的神经芯片内部
右图展示了装有莫德哈金色神经芯片的电路板。在金色方块内部,有一个更小的金色矩形,大小如米粒。这个矩形是核心,容纳着生物神经细胞或神经元的电子等价物。
在活神经元中,电化学信号沿着一根细长的茎(称为轴突)传播,到达称为树突的突起。信号从轴突跨越突触(或间隙)跳到神经网络中下一个神经元的树突上。
这个过程在莫德哈的硅芯片中得到了模拟,其中核心中的256个处理器各自充当一个人造神经元,从自己的“树突线”接收信号。(参见右侧放大网格。)这些线路彼此平行排列,但与发送信号的“轴突线”垂直。
在网格中,每个轴突-树突交叉点都是一个突触——类似于生物突触——它将脉冲从轴突线传输到所有处理器。在神经元中,如果信号足够强烈,它就会穿过突触。在莫德哈的金色核心中,每个处理器都会计算它通过树突从传入轴突接收到的信号。
如果超过某个阈值,处理器就会发出自己的信号或尖峰。尖峰通过绿色电路板路由到外部计算机进行数据收集,然后发送回芯片。
— 沈方菲

IBM 研究院
猕猴大脑图谱
为了更深入了解神经计算,莫德哈绘制了猕猴的大脑图谱,其结构与我们人类的大脑相似。他随后利用这份图谱在IBM超级计算机上模拟了人类规模的大脑。
猕猴衍生的地图模拟了核心——前额皮质和大脑中参与意识、认知和高级思维的其他部分。整个网络的通信主要通过核心进行,88%的连接都在此处开始或结束。
在计算机中,这种连接性可以通过跨越整个系统的金色芯片网络来实现。莫德哈发现最有趣的是,猕猴最内部的核心似乎包含了人类大脑中发现的两个脑网络——一个激活内省思维,另一个激活目标导向行为,这表明它在意识中扮演着特殊角色。
为了在机器中扮演这个角色,核心必须连接到大脑的其他部分,如右图所示。在那里你可以看到大脑皮层,它是记忆和智力的中心,以及它的四个主要部分:额叶,与高级认知和表达性语言相关;顶叶,与处理压力、触觉和疼痛相关;以及分别处理视觉和听觉的枕叶和颞叶。
为了模仿猕猴,莫德哈还包括了代表基底神经节(控制运动和动机)、脑岛和扣带回(两者都参与情绪处理)以及许多其他区域的电路,总共有383个区域由6602个独立的连接链接。
— 沈方菲










