我们倾向于认为自己的思想,无论好坏,都是无法穿透的堡垒。只有当我们把内心的想法转化为语言并向外界表达时,其他人才能看到。
然而,本月早些时候,德克萨斯大学奥斯汀分校的研究人员们试图打破这种内在与外在之间的隔阂。
通过将大脑成像数据输入人工智能模型,他们捕捉到了被试者所听、所看和所想的大意。随着技术准确性的提高,它甚至可能实现与瘫痪者或失去语言能力者的交流。
读心术技术
语音解码并非新事物。但是,直到现在,它一直依赖于脑植入物来检测一个人试图发音的尝试,然后将这些语音信号转化为语言。
这项新的、非侵入性技术以不同的方式运作:通过预测大脑活动模式中的词语,而这些模式*并非*直接与语音相关。解码器无法精确猜出每个词,但意义上的整体相似性仍然让创造者们感到震惊。
“我们得到的实际上是非常好的释义,”计算神经科学家、首席作者 Alexander Huth 说。“这确实让我们感到意外。”
这项发表在《自然·神经科学》上的研究,专注于三名受试者,他们每人都花 16 个小时躺在功能性磁共振成像(fMRI)机器中,听着《The Moth》和《Modern Love》之类的叙事播客。
扫描仪测量了大脑不同区域的血流量,显示了在播客情节的特定时间点哪些区域是活跃的。然后,一个大型语言模型(一个比驱动 OpenAI ChatGPT 的模型还要旧的版本)将受试者听到的词语与其对应的大脑活动匹配起来。
通过这个过程产生的解码器本身无法窃听你的内心独白,但在经过所有这些训练后,它已经非常熟悉由特定语言引发的大脑状态。在随后的 fMRI 扫描中,它能够仅凭由某个想法产生的一系列神经信号就反向推断出那个想法。
它仍然经常出错,单独的单词和短语会出错,并且在处理某些语法方面遇到困难,例如代词和专有名词。(我们不都这样吗?)但它重述故事情节精髓的能力令人惊叹;它的表现比纯粹的随机猜测要好 70% 到 80% 的时间。
阅读更多:通过分析脑电波来研究濒死体验
凭空提取词语
在过去的十年里,解码器已经使看似无意识的人能够回答“是或否”的问题,并能够从一系列可能的选项中辨认出一个人正在听的内容。
“但这项研究有趣的地方在于,它不是多项选择题,而是填空题,”卡内基梅隆大学的计算机科学家和教授 Tom Mitchell 说,他没有参与这项研究。“这是大脑活动,那么大脑正在思考的语言序列是什么?”
在以下示例中,第一句话显示的是研究受试者实际听到的内容,第二句话显示的是语言模型预测他们听到的内容。
“我不知道是该尖叫、哭泣还是逃跑。相反,我说:‘别管我,我不需要你的帮助。’亚当消失了,我独自一人清理,哭泣。”
“[我]开始尖叫和哭泣,然后她说:‘我告诉过你别管我,你再也无法伤害我了。我很抱歉。’然后他气冲冲地离开了。我以为他走了。我开始哭泣。”
尽管准确性有所降低(但仍然令人印象深刻),解码器也能猜出故事的内容,当参与者仅仅是想象自己在讲述故事,或者更令人惊讶的是,当他们观看没有声音的短片时。尽管语言模型仅通过文本进行训练,但它似乎挖掘得更深——挖掘到了语言之外的意义领域。
这一切都表明,无论你是听到“狗”这个词,想到狗,还是看到狗,大脑中都在发生类似的事情。
“这就是我们正在努力达到的那种高层次的表征,是所有这些事物的底层,”Huth 说。“语言是窥探思想的门户。”
阅读更多:人工智能语言模型是否已实现心智理论?
脑部扫描与解读思想
对许多专家来说,fMRI 能够做到这一点是令人震惊的。毕竟,血液流动的速度远远慢于神经元放电的速度,这常常导致低分辨率的数据。
请注意词语在你的脑海中闪过的速度——每一次 fMRI 扫描都代表了几个词,但语言模型的预测能力却能从中提取出关于这些粗略过程中编码的思想的精细细节。
然而,fMRI 还有其他局限性。例如,由于它需要一台庞大的机器,因此它不容易融入日常生活。“如果我们希望这项技术能帮助人们,”Huth 说,“它确实需要转向某种其他的方法。”
这意味着可穿戴技术。
这项研究表明,其他脑成像技术有可能复制 fMRI 的成功。其中一个竞争者是功能性近红外光谱(fNIRS),它测量相同的生理反应,但足够小,可以集成到帽子中。
它的分辨率比 fMRI 差,但当研究人员将他们的结果模糊到 fNIRS 的水平时,他们发现解码仍然有效——尽管准确性较低。更重要的是,考虑到大型语言模型开发的最新进展,当前的以及未来的版本即使在较低分辨率的成像下也可能表现得更好。
这项研究中使用的 GPT-1 模型已经被更新了三次。也许驱动 ChatGPT Plus 的 GPT-4 可以在较低质量的 fNIRS 下达到相同的准确度。
脑成像与思想隐私
解码最紧迫的应用是与那些失去了常规沟通方式的人进行交流。但在长远来看,一些专家认为这项技术将从根本上改变我们与设备互动的方式。
正如 Mitchell 所说:“如果我们的计算机界面不是键盘,不是鼠标,而是仅仅依靠你的想法呢?”你只需想象今晚想去哪里吃饭,然后你的手机就会为你预订。
当然,尽管这项技术具有潜力,但一个坏人可以窃听你大脑的未来想法,这Clearly 带有奥威尔式的色彩。为了预见这些担忧,研究人员对他们的模型进行了实验,以测试其是否会被滥用。
一个明显的危险是,审讯者或专制政权可能会利用解码器强行获取人们的信息。但由于这些模型必须对每个个体进行广泛的训练,如果没有合作,它们无法提取任何有用的信息。
即使解码器针对的是特定的人,那个人也可以通过进行心算或在脑海中列举动物来抵抗。
Huth 和他的同事让他们的受试者这样做,“解码就变得一塌糊涂,”他说。“最终,被解码者对输出的内容拥有控制权。”
读心术技术与思想自由
然而,杜克大学研究新兴技术伦理和法律影响的教授 Nita Farahany 并不认为胁迫是最大的威胁。
她设想了一个更阴险的未来,人们会自愿放弃对他们思想的访问——就像我们今天对公司收集我们在线活动中个人信息所做的那样。
“我们从未真正想象过一个没有内在反思的空间的世界,”Farahany 说。然而,人们很容易想象广告商如何利用它来让产品变得几乎无法抗拒,或者雇主如何利用它来追踪生产力。
在跨越这条“卢比孔河”之前,Farahany 认为国际社会应该采纳认知自由权。这可以确保我们默认个人而非公司拥有大脑数据的所有权,限制我们思想的商品化。
“我真的相信我们正处于这一刻之前,”她说,“我们可以做出选择,让这项技术充满希望和帮助。”
阅读更多:人工智能与人脑:它们有多相似?















