我们对世界的感知通常是如此轻松自然,以至于我们往往视而不见。我们看,我们看见,我们理解——这似乎如同水往低处流一样自然而理所当然。
为了理解感知,我们首先需要摒弃这样一种观念:眼睛后部形成的图像只是被“传递”到大脑,然后在屏幕上显示出来。相反,我们必须认识到,一旦光线在眼后部转化为神经冲动,就再也没有意义去将视觉信息视为图像了。我们应该将其视为代表图像中场景和物体的符号化描述。比如,我想让别人知道房间对面那把椅子是什么样子的。我可以带他到那里指给他看,让他自己观察,但这并不是符号化描述。我可以给他看椅子的照片或图画,但这仍然不是符号化,因为它具有物理上的相似性。但是,如果我给那个人一张纸条,上面描述着这把椅子,我们就进入了符号化描述的领域:纸上的墨迹符号与椅子本身没有任何物理上的相似之处;它们仅仅是它的象征。
同样地,大脑会创造符号化描述。它不会重塑原始图像,而是用全新的术语来表示图像的各种特征和方面——当然不是用墨迹符号,而是用它自己的神经冲动字母表。这些符号编码一部分在视网膜本身形成,但大部分在大脑中形成。一旦形成,它们会被打包、转换并组合在广泛的视觉脑区网络中,最终使我们能够识别物体。当然,绝大部分这种处理过程都在幕后进行,不会进入我们的意识,这就是为什么它感觉毫不费力且显而易见。
在灵长类动物(包括人类)中,大脑的很大一部分——包括枕叶以及颞叶和顶叶的一部分——都致力于视觉。这一部分内大约30个视觉区域中的每一个都包含着对视觉世界的完整或部分映射。我们并不确切知道为什么我们高等灵长类动物拥有如此多的不同区域,但它们似乎都专门负责视觉的不同方面,例如颜色视觉、运动感知、形状识别、面孔识别等等。其中每一个的计算策略可能截然不同,以至于进化分别发展了神经硬件。
那个无法感知运动的女人
一个很好的例子是内侧颞区(MT),这是大脑每个半球中一小片皮层组织,主要负责感知运动。在20世纪70年代末,苏黎世的一位我称之为英格丽德的女士中风,导致她大脑两侧的MT区域受损,但她大脑的其他部分完好无损。
在大多数方面,英格丽德的视力都很正常:她能看报纸,也能认出物体和人。但她很难看清运动。当她看一辆行驶的汽车时,汽车就像一连串静止的快照,仿佛在频闪灯下看到的。她害怕过马路,因为她不知道汽车接近的速度有多快。当她往玻璃杯里倒水时,水流看起来像一个静止的冰柱。她不知道什么时候该停止倒水,因为她看不到水位上升的速度,所以水总是会溢出来。她甚至表示,和人说话就像“打电话”,因为她看不到他们的嘴唇在动。生活对她来说变成了一种奇怪的折磨。
因此,看来MT区域主要负责感知运动,而不是视觉的其他方面。其他证据也支持这一观点。
不幸的是,灵长类大脑中那大约30个视觉区域中的大多数,在受到损伤、成像或刺激时,其功能并不像MT区域那样清晰地展现出来。这可能是因为它们不像MT那样狭窄地专业化,或者它们的功能更容易被其他区域补偿(就像水绕过障碍物流淌一样),或者也许我们对构成单一功能的定义是模糊的(用计算机科学家的术语来说就是“不适定”)。但无论如何,在所有令人困惑的解剖学复杂性之下,存在一个简单的组织模式,这对视觉研究非常有帮助。这种模式是将视觉信息沿着(半)分离的并行通路进行分流。
首先,让我们考虑视觉信息进入皮层的两条通路。所谓的旧通路始于视网膜,通过一个古老的中脑结构——上丘进行中继,然后通过丘脑枕到达顶叶。这条通路负责视觉的空间方面:物体在哪里,而不是物体是什么。旧通路使我们能够朝向物体并用眼睛和头部追踪它们。如果破坏了仓鼠的这条通路,它就会出现一种奇怪的隧道视野,只能看到和识别鼻尖前的东西。
新通路在人类和一般灵长类动物中高度发达,能够对复杂的视觉场景和物体进行精密的分析和识别。这条通路从视网膜投射到V1区域,然后从那里分成两条子通路,或称为“流”:通路一,通常称为“如何”流;通路二,称为“是什么”流。你可以将“如何”流视为关注视觉对象在空间中的相互关系,而“是什么”流则关注视觉对象本身内部特征的相互关系。“如何”流投射到顶叶,并与运动系统有很强的联系。当你躲避迎面而来的物体时,当你绕房间行走避免碰撞时,当你小心翼翼地跨过树枝或坑洞时,你都在依赖“如何”流。这些计算大多是无意识且高度自动化的,就像一个机器人或一个僵尸副驾驶,它会遵循你的指令,而不需要太多指导或监控。
在我们考虑“是什么”流之前,让我先提一下一个令人着迷的视觉现象——盲视。它是在20世纪70年代末由拉里·韦兹克朗茨在牛津发现的。一位名叫盖的病人左侧视觉皮层——“如何”流和“是什么”流的起点——严重受损。结果,他的右侧视野完全失明——至少一开始是这样。在测试盖完好的视力时,韦兹克朗茨让他伸手去触摸一个他告诉盖在他右边的一个小光点。盖抗议说他看不到,但韦兹克朗茨让他试试。令他惊讶的是,盖准确地碰到了那个点。盖坚持说他只是在猜测,当被告知他指对了之后他感到很惊讶。但反复的试验证明,这并非幸运的猜测;盖的手能够准确地找到一个又一个目标,尽管他没有任何关于它们在哪里或它们是什么样子的视觉体验。韦兹克朗茨将这种综合征命名为盲视,以强调其悖论性质。
一个人怎么能定位一个他看不见的东西呢?答案在于大脑中旧通路和新通路之间的解剖学划分。盖的新通路,即通过V1的通路,已经受损,但他的旧通路完好无损。关于光点位置的信息顺利地传到了他的顶叶,而顶叶又指挥他的手移到正确的位置。
从感知到行动
现在让我们来看看通路二,“是什么”流。这条通路主要负责识别一个物体是什么,以及它对你意味着什么。这条通路从V1投射到梭状回,然后从那里投射到颞叶的其他部分。梭状回本身主要执行对象的枯燥分类:它区分P和Q,鹰和手锯,以及乔和简,但它并不给其中任何一个赋予意义。
但是,当通路二穿过梭状回进入颞叶的其他部分时,它不仅会唤起事物的名称,还会唤起与之相关的记忆和事实的“光环”——广义上讲,是对象的语义或意义。你不仅能认出乔的脸是“乔”,还能记起关于他的各种事情:他娶了简,他有古怪的幽默感,他对猫过敏,而且他是你保龄球队的队员。这种语义检索过程涉及到颞叶的大范围激活,但似乎集中在几个“瓶颈”上,包括韦尼克语言区和下顶小叶,后者涉及命名、阅读、写作和算术等人类特有的能力。一旦在这些瓶颈区域提取了意义,信息就会被传递到杏仁核,杏仁核位于颞叶的前端,用于唤起你对所见事物(或人)的情感反应。
除了通路一和通路二,似乎还有一条我称之为通路三的、更具反射性的、处理对象情感反应的替代通路。如果前两条是“如何”流和“是什么”流,那么这条就可以被认为是“所以呢?”流。在这条通路中,具有生物学意义的刺激,如眼睛、食物、面部表情和动画(如人的步态和姿势),从梭状回穿过颞叶的一个区域——称为颞上沟,然后直接到达杏仁核。换句话说,通路三绕过了高级对象感知——以及通路二通过联想唤起的丰富光环——并迅速导向杏仁核,它是大脑情感核心——边缘系统的门户。这种捷径可能是为了促进对高价值情况的快速反应而进化的,无论是天生的还是后天习得的。
杏仁核与过去储存的记忆以及边缘系统中的其他结构协同工作,以衡量你所看到的任何事物的意义:它是朋友、敌人还是伴侣?或者它只是一件平凡的事情?如果它很重要,你会立即有所感觉。如果是一种强烈的情感,杏仁核的信号还会级联到你的下丘脑,下丘脑不仅协调激素的释放,还激活自主神经系统,让你做好准备采取适当的行动,无论是进食、战斗、逃跑还是求爱。(医学生使用“四个F”的助记符来记住这些。)
我们有多少视觉区域是人类独有的,这一点并不清楚。但对它们的了解远比对大脑其他高级区域(如额叶,涉及道德、同情和野心等功能)要多。因此,透彻理解视觉系统的工作原理,可能会为大脑处理信息的通用策略提供见解,包括那些对我们来说是独一无二的策略。
摘自 V. S. Ramachandran 的著作 *The Tell-Tale Brain: A Neuroscientist’s Quest for What Makes Us Human*。版权所有 2011 V. S. Ramachandran。经出版商 W. W. Norton & Co. 授权转载。















