一张图像在数百次试验中被演化,猴子神经元选择它最喜欢的内容。(来源:Ponce, Xiao, and Schade et al./Cell) 印象派艺术,或许是噩梦的燃料——这些图像对人眼来说是一团混乱。但据一群研究人员称,对猕猴的大脑细胞来说,这些图像是引人入胜的。这些图片是一个将人工智能与灵长类智能配对的实验的结果。目的是创造专门用于刺激猴子视觉皮层神经元的图像。这并非是为了创作以猴子为中心的艺术。相反,这些杂乱的图像可能有助于我们理解大脑看待世界的方式。研究人员表示,这些渲染出的图像比自然图像更能激发猴子大脑的反应。
神经元如何看见
科学家们并不完全理解将进入的光子转化为我们脑海中连贯图像的过程。我们所知道的是,我们的大脑有多个处理视觉的神经元层,每一层都有其自身的功能。当特定图像的神经信号通过这些层时,它会逐渐被塑造成一个连贯的表征。然而,这个过程究竟是如何发生的,仍然是个谜。因此,为了缩小问题范围,来自哈佛大学和华盛顿大学医学院的研究人员尽可能地深入研究,观察单个神经元。他们正在研究视觉处理系统中一个叫做“下颞叶皮层”(IT皮层)的部分。IT皮层在视觉处理流水线的末端发挥作用,其主要功能似乎是识别物体。事实上,得益于IT皮层受损的患者,这一功能早已被人们所知。“如果你失去大脑的那一部分……你可以看见,但你无法识别事物。你患有称为‘失认症’的疾病——一种非常选择性的、无法识别特定类别物体的损失,”哈佛神经生物学家、该论文的合著者玛格丽特·利文斯通说。通过观察IT皮层中单个神经元对图像的反应,研究人员可以了解该特定神经元对什么敏感。之前的实验表明,IT皮层中的细胞或细胞簇对诸如面部或手等事物有强烈的反应。但这种假设是基于有根据的猜测,因为研究人员能够“展示”给神经元的物品数量有限,以观察它是否会做出反应。也许有些神经元对“手”敏感,但对“章鱼”——甚至对现实世界中不存在的图像——反应更强烈。

一张由猕猴神经元在人工智能的帮助下演化出的图像。(来源:Ponce Xiao and Schade et al./Cell)
机器视觉
为了解决这个问题,研究人员转向了人工智能。他们给植入了IT皮层电极的猕猴展示了一组 40 张随机生成的抽象图案图像,并观察了哪些图案对它们的神经元刺激最大。其中 10 张效果最好,被用来生成新的一组图像。这个过程进行了几百轮,或称几代,这取决于猕猴能够被说服多长时间盯着屏幕。根据发表在Cell上的研究,在实验结束时,研究人员得到了一组经过多代演化的图像,这些图像描绘了特定神经元或神经元群体最喜欢的内容。呈现的形状是混乱的,但可识别的特征出现了:其中一张看起来像一张猴子脸,另一张则像一个戴着面具、穿着长袍的实验室成员。然而,这些特征看起来是扭曲的,像是猴子或人类的长相的漫画。利文斯通说,这揭示了神经元如何编码或识别物体的一个重要见解。“你可能会认为,一个关心面部的细胞,其最佳刺激物应该看起来像一张脸,”她说。“相反,它看起来像一个地精,或者一个滴水嘴,或者一个莱普利肯。所以这告诉我们,神经元编码的是极端情况,而不是典型事物。”它暗示着,当我们的神经元识别诸如面部之类的物体时,它们并不是通过存储人类面部的每一种排列的图像,而是简单地编码面部光谱的两个极端。确定某个特定面孔落在两个极端之间的哪个位置,是我们的神经元识别事物的更简单的方式。“你的大脑可能充满了编码你从未实际看到过的东西的神经元,但它们编码的是事物与其他事物之间的差异,”利文斯通说。结果是,一些神经元最容易对我们现实世界中从未见过的东西做出反应。实验中的图像证实了这一点——它们并非对我们世界的准确描绘,而是对其扭曲的表征。然而,让利文斯通感到惊讶的是,单个神经元能够识别出如此复杂的物体。脸是一个复杂的物体,由多个特征组成:眼睛、鼻子、嘴等。关于视觉处理的一个理论认为,单个神经元可能编码简单的特征,然后协同工作来构建面部图像。但单个神经元引导算法构建了整个面部,这表明我们的大脑细胞可以单独识别复杂的物体。当然,这并不意味着我们大脑中有一个神经元对应我们认识的每张脸,或者对面部识别的解析度取决于单个脑细胞。我们的神经元相互连接成网络,协同工作以理解我们周围的视觉世界。但利文斯通的研究强化了单个神经元可以执行复杂、特定的任务,并且我们可以找到这些任务是什么。对我们来说,这些个体神经元构想出的艺术可能并不太合理,但这也可以预料——它们只是一个更大的合唱团中的一个声音。














