Lou Barbe 不会称自己为狂热的游戏玩家。作为法国雷恩大学的生态学家,他大部分时间都在与植物打交道。但有一款游戏从小就吸引了他的想象力:《星际争霸》,这款流行的在线策略系列游戏,玩家在其中积累资源并组建外星战士军队,在外星景观中发动战争。“我根本不是个好玩家,”Barbe 说,“但我明白是怎么回事。”
几年前,在玩《星际争霸II》(这款游戏的最新版本)时,Barbe 意识到,在所有的爆炸和激光中,还有别的事情在发生。《星际争霸》的运作方式很像一个生态系统。“我们有环境,”Barbe 说,“我们有资源。有生物在这个环境中竞争。这就是生态系统的定义。”
Barbe 将这个想法记了下来。然后,在 2019 年,谷歌母公司 Alphabet 的人工智能研究子公司 DeepMind 将一款名为 AlphaStar 的人工智能与之世界顶尖的《星际争霸II》玩家进行了较量。AlphaStar 以 99.8% 的优势击败了人类玩家,获得了梦寐以求的“宗师”称号——这是游戏中的最高等级——为计算机在人工智能霸权之路上又添一笔胜利。

(图片来源:Blizzard Entertainment)
Blizzard Entertainment
Barbe 认为,AlphaStar 的能力可能不仅仅局限于操纵虚拟行星上的外星人。如果《星际争霸》的运作方式很像一个生态系统,那么也许玩游戏的算法可以帮助研究地球上的生态问题。
Barbe 和来自雷恩大学以及杨百翰大学的其他生态学家于 2020 年在《生态与进化趋势》杂志上发表文章,解释了 AlphaStar 管理《星际争霸》复杂、多维动态的能力如何被重新利用,以测试有关现实世界生态系统动态的观点,这些观点曾让传统模型感到困惑。例如,研究人员可以部署 AlphaStar 代理在设计用来模拟现实资源分布的《星际争霸》地图上,以模拟不同生物如何应对入侵物种或栖息地丧失等干扰。
Barbe 说,AlphaStar 算法可能无意中成为了目前最复杂生态模型。
这一想法加入了生态学领域利用强大人工智能工具分析环境问题的更广泛运动。尽管在 15 到 20 年前相对不常见,但科学家们表示,人工智能在该领域的应用近年来爆炸式增长,从对野生动物物种进行分类到预测松树林中的甲虫爆发。生态学家认为,人工智能工具与收集地球海量数据的新能力相结合,可以改变生态系统的研究方式,并增强我们预测其变化的能力。像 AlphaStar 这样通常为与生态学无关的目的而开发的高度复杂算法,可以帮助推进这项研究。

(图片来源:Blizzard Entertainment)
Blizzard Entertainment
“(大多数)生态模型与某些人工智能系统内部的复杂性相比,都非常小,”杨百翰大学生态学家、AlphaStar 论文的合著者 Ben Abbott 说,“我们真的只是触及了这些方法能做什么的表面。”
培育冠军
对于人工智能研究人员来说,《星际争霸II》自 2010 年发布以来一直是一个巨大的挑战。与国际象棋或围棋一样,《星际争霸》玩家控制不同的单位来攻击对手,但他们还必须选择在哪里以及何时收集资源,何时建造新单位以及建造哪些单位,等等其他复杂的因素。国际象棋每回合大约有 35 种可能的走法,围棋有 200-250 种,而《星际争霸II》有 10^26 种可能的走法。而且,与游戏理论家所说的“完美信息”游戏(所有玩家都能看到整个游戏空间)不同,《星际争霸》是在一个玩家只能部分观察的大地图上进行的。进一步增加复杂性的是,玩家扮演三个外星种族之一——人类、星灵或异形——每个种族都有其独特的优势和劣势。
为了创造一个能在《星际争霸II》中击败最强玩家的人工智能,DeepMind 的研究人员使用了机器学习技术来训练 AlphaStar 算法。首先,研究人员创建了一个人工智能代理组成的联盟,该联盟通过对数十万场人类《星际争霸》比赛的数据进行训练。然后,他们将这个虚拟代理联盟相互对抗,选择最强的代理并进行重组,然后再将其送回联盟。他们重复这个过程,直到 AlphaStar 这个巨头出现。领导 DeepMind AlphaStar 团队的 Oriol Vinyals 将该联盟本身比作受自然选择过程影响的一种生态系统。“AlphaStar 联盟的设计灵感很大程度上源于进化文献,”他说。

《星际争霸II》中的三个外星种族之一,生长缓慢的人类,在游戏生态系统中表现得有点像仙人掌。(图片来源:Saran_Poroong/Shutterstock)
Saran_Poroong/Shutterstock
虽然人工智能研究人员从大自然中获得灵感,但 Barbe 和他的生态学家同行们则从游戏中获得灵感。在他们 2020 年的论文中,他们详细阐述了《星际争霸》中的人类、星灵和异形种族与某些类型生物的竞争策略之间更深层次的相似之处。例如,异形单位是快速的殖民者但战斗力较弱,类似于植物的 Ruderal 物种——小而杂乱,但在生态系统受到干扰后最先生长。而星灵则像蕨类植物,它们消耗大量资源,并且群体生长效果最好。人类则像仙人掌:生长缓慢,但擅长防御。就像在真实的生态系统中一样,这些“物种”采用不同的策略来争夺资源,形成复杂的互动模式。
尽管他还没有正式尝试过,但 Barbe 认为观察 AlphaStar 代理在《星际争霸》中的互动方式,可以作为一种测试生态和进化过程假说的方法,这是常规统计模型无法捕捉的——例如,预测《星际争霸》地图一角可用资源的小变化如何影响到另一角竞争的人类和异形单位。将人类和异形替换成松树和树皮甲虫,你就可以开始看到这样的预测对环境管理者来说有多么宝贵。“这就像一个科学家可以玩弄生态系统的沙盒,”Barbe 说。
“它可能会变成一个非常有趣的玩具模型,你可以有一个非常简化的系统并提出非常具体的问题,”俄勒冈州立大学的数据科学家 Anne Thessen 说,她并未参与《星际争霸》生态学论文的研究。“你只需要记住,这是一个模拟。”
热门技术
事实上,《星际争霸II》——尽管其复杂性很高——但与真实的生态系统相比,它仍然简单得多。Barbe 指出,像氮循环这样的基本自然过程在游戏中并不存在,生物之间的关键关系,如寄生关系,也不存在。而且只有三个物种。

(图片来源:Blizzard Entertainment)
Blizzard Entertainment
“我认为一个问题是,游戏的机制——它是为了尽可能有趣而设计的——与真实的物理世界只有表面上的相似之处,”慕尼黑工业大学的生态学家 Werner Rammer 评论道。
Rammer 说,这将使将 AlphaStar 的玩法观察结果(无论多么复杂)推广到游戏参数之外变得具有挑战性。
然而,无论生态学家是否会使用 AlphaStar 进行研究,越来越多的人工智能工具正在被应用于生态学和环境科学领域的问题。
Thessen 说,十年前,人工智能在生态学和环境科学中的应用主要限于分类任务,例如快速识别鸟鸣录音中的物种或卫星图像中的景观类型。现在,她说,生态学领域的人工智能正超越分类,承担更广泛、更具雄心的任务,例如基于通常由生态学产生的杂乱、高维数据进行预测。
但加拿大蒙克顿大学(加拿大)的北极和北方生态学研究主席、生态学家 Nicolas Lecomte 表示,人工智能在生态学中的应用仍未得到充分利用。他使用人工智能工具对北极鸟类叫声进行分类并预测其迁徙模式。“生态学家可能会被训练人工智能算法所需的编程技能所吓倒,”他解释道。Abbott 同意,收集足够的数据来训练算法可能很困难。“有些数据很容易获得,比如卫星图像,但有些可能更难收集,比如土壤样本。”
Abbott 表示,其中一些只是因为生态学领域缺乏资金和有技能的合作者——他指出,这并不是一个“易于货币化”的领域。他说,像制作《星际争霸》的 Blizzard 这样的公司,“每年花费数亿美元来开发运行其游戏的算法。”“他们的资源比我们多得多。但我们当然认为我们的问题比他们的问题更重要。”他只是半开玩笑——毕竟,对于地球上的生命来说,这不仅仅是一场游戏。















