
在瑞士的一个实验室里,一群十个机器人正在争夺食物。这些机器在一个小型竞技场中巡逻,它们是工程师 Sara Mitri 和 Dario Floreano 以及进化生物学家 Laurent Keller 正在进行的一项创新研究的一部分,该研究旨在观察交流的演变。
他们编程机器人,让它们在竞技场的一端寻找一个由浅色环表示的“食物来源”,它们可以用朝下的传感器在近距离“看到”这个环。竞技场的另一端,用一个深色环标记,是“有毒的”。机器人根据它们在食物或毒物附近花费的时间获得积分,这表明它们在人工生活中的成功程度。
它们还可以相互交流。每个机器人都可以发出蓝光,其他机器人可以用摄像头检测到,并通过闪烁的机器人聚集在附近来暴露食物的位置。简而言之,蓝光携带信息,经过几代之后,机器人迅速进化出了隐藏信息和相互欺骗的能力。

它们的进化之所以可能,是因为每个机器人都由一个由二进制“基因组”控制的人工神经网络提供动力。该网络由11个连接到机器人传感器的神经元和3个控制其两个履带和蓝光的神经元组成。神经元通过33个连接——突触——连接起来,这些连接的强度都由一个8位基因控制。总的来说,每个机器人的264位基因组决定了它如何对从其感官中获取的信息做出反应。
在实验中,每一轮由100组10个机器人组成,每个机器人都在一个单独的竞技场中争夺食物。得分最高的200个机器人——种群中最适应的——“幸存”到下一轮。它们的33个基因被随机突变(任何位有百分之一的机会改变),并且机器人相互“交配”以打乱它们的基因组。结果是新一代机器人,它们的行为继承自上一代中最成功的代表。
在最初的实验中,机器人随机发出蓝光。即便如此,随着机器人越来越擅长寻找食物,光线变得越来越有信息量,并且仅仅经过9代之后,机器人就越来越被它吸引。
但对于真正的动物来说,传达食物的位置并不总是符合机器人的最佳利益。红环只有8个机器人的空间,所以如果不是每个机器人都出现,它们就必须为了觅食权而相互推搡。当Mitri、Floreano和Keller允许蓝光的发射与机器人其余行为一起进化时,这种竞争的影响变得清晰。
和以前一样,它们起初是随机发光的,当它们开始聚集在食物周围时,它们的灯光越来越多地暴露了食物的存在。随之,机器人变得更加隐秘。到第50代,它们在食物附近发光的可能性比在竞技场其他地方发光的可能性要小得多,而且灯光变成了信息来源更差、对机器人吸引力也小得多的东西。
尽管如此,光线从未变得完全无用。随着机器人变得越来越精明,越来越少地依赖灯光,那些真正在食物附近发光的个体为此付出的代价要小得多。因此,保持其他个体处于黑暗中的进化压力较低,灯光提供的信息从未真正被压制。

这也意味着机器人的行为差异巨大。随着自然选择的束缚放松,诸如遗传漂变(基因随机发生变化)等过程得以自由产生更多的遗传多样性和更丰富的行为。经过大约500代进化,大约60%的机器人从未在食物附近发光,但大约10%的机器人大部分时间都在发光。一些机器人对蓝光略有吸引,但三分之一的机器人被它强烈吸引,另有三分之一的机器人实际上被它排斥。
Mitri、Floreano和Keller认为,自然界中也存在类似的过程。当动物移动、觅食或一般进行生活时,它们会提供无意的线索,这些线索可以向其他个体传递信息。如果这造成利益冲突,自然选择将偏爱那些能够抑制或调整这些信息的个体,无论是通过隐秘、伪装、干扰还是彻头彻尾的谎言。正如机器人实验一样,这些过程有助于解释自然界中各种各样的欺骗策略。
参考:PNAS 10.1073/pnas.0903152106
更多关于机器人
















