神经科学中最被广泛研究的网络之一是果蝇的大脑,特别是被称为“蘑菇体”的部分。它分析气味、温度、湿度和视觉数据等感官输入,以便果蝇能够学会区分有利刺激和危险刺激。
神经科学家们早就知道这部分大脑是如何连接的。它由一组称为投射神经元的细胞组成,这些细胞将感官信息传递给约 2,000 个称为 Kenyon 细胞的神经元群体。Kenyon 细胞相互连接,形成一个能够学习的神经网络。
这就是果蝇学会避免潜在危险的感官输入(如危险气味和温度),同时学会接近食物、潜在配偶等的方式。
但是,这个相对较小的网络的强大功能和灵活性长期以来一直让神经科学家们产生一个好奇的问题:它能否被重新编程来处理其他任务?
现在, thanks to the work of Yuchan Liang at the Rensselaer Polytechnic Institute, the MIT-IBM Watson AI Lab, and colleagues,他们得到了答案。这个团队已经破解了果蝇大脑网络,使其能够执行其他任务,例如自然语言处理。这是首次以这种方式被征用一个自然存在的网络。
而且,这个生物大脑网络并非等闲之辈。Liang 和他的团队表示,它在处理能力上与人工智能学习网络相当,但使用的计算资源却少得多。
计算机模拟网络
这种方法相对简单。该团队首先使用计算机程序重建了蘑菇体所依赖的网络——将一些投射神经元的数据输入到大约 2,000 个 Kenyon 细胞中。然后,该团队训练这个网络识别文本中单词之间的相关性。
这项任务基于这样一个观点:一个词可以通过其上下文,或者它通常出现的其他词来定义。其思想是,从大量的文本开始,然后对于每个单词,分析出现在它之前和之后的单词。
通过这种方式,机器学习系统可以学会预测句子中的下一个单词,给定已经出现的单词。许多系统,如 BERT,都使用这种方法来生成看似自然的句子。因此,Liang 和他的团队教会了果蝇大脑网络做同样的事情。
事实证明,即使该自然网络是为了完全不同的目的而进化的,它在这方面也相当出色。“我们证明了这个网络可以学习单词的语义表示,”Liang 和他的同事说。
在他们的工作中,他们进一步指出,果蝇大脑网络在自然语言处理方面的性能与现有方法相当。最重要的是,该生物网络仅使用了计算资源的一小部分。他们所谓的“一小部分”是指它需要更短的训练时间,同时使用更小的内存占用。
生物效率
这是一个有趣的结果。“我们将这一结果视为一个普遍陈述的例子,即受生物启发的算法可能比其经典(非生物)的对应物计算效率更高,”Liang 和他的同事说。
这项工作提出了一系列引人入胜的问题。一个显而易见的难题是,为什么生物网络如此高效。显然,进化在选择自然界中更优良的网络方面发挥了作用。但是,Liang 和他的同事并没有评论使 Kenyon 细胞网络如此高效的特定属性或架构。
这项工作还提出了其他生物网络可以以同样的方式被征用的可能性。然而,一个潜在的问题是神经科学家在描述更复杂的大脑(如哺乳动物大脑)中的网络时遇到的困难。因此,在与小鼠、海豚或人类大脑相关的网络能够以这种方式被破解之前,可能还需要一些时间。
参考:arxiv.org/abs/2101.06887, 果蝇能否学习词嵌入?














