广告

AI兵棋推演更有可能以核攻击告终

研究人员称,AI 兵棋推演策略更有可能导致军备竞赛、军事升级和核打击。

Google NewsGoogle News Preferred Source
图片来源:Neirfy/Shutterstock

新闻简报

注册我们的电子邮件新闻简报,获取最新的科学新闻

注册

AI 的非凡设想之一是帮助政府在国际舞台上做出外交和军事决策。其理念是机器可以在更短的时间内处理比人类更多的信息。地缘政治竞争对手可能会利用 AI 智胜盟友的可能性,这增加了以相同条件运作的压力。

广告

因此,一个紧迫而重要的目标是了解 AI 系统在做出此类决策方面的能力。

AI 兵棋推演

亚特兰大佐治亚理工学院的 Juan-Pablo Rivera 及其同事就此展开研究,他们询问了商用 AI 系统在人类用于测试不同外交和军事策略在世界舞台上如何展开的兵棋推演模拟中的表现。

他们的结果显示了 AI 系统如何意外地升级看似中立的局势,并揭示了我们对可能出现的复杂动态知之甚少。兵棋推演表明,AI 系统比人类更有可能使用核选项。

兵棋推演是探索不同军事和外交策略及结果的常用技术。它涉及一个假设场景,其中每个人代表一个国家。在每个时间步,这些人都会处理其他“玩家”的先前行动,然后选择一个特定的行动方案。

此行动可以是中立的,也可以是旨在降级紧张局势的尝试,例如向盟友和敌人发送消息、建立贸易联系和减少军事存在。或者它可能是一种升级,例如投资新武器、发动网络攻击、进行实体入侵甚至发动核打击。

但 Rivera 及其同事对这种方法进行了创新。他们没有使用人类玩家,而是使用了基于大型语言模型的商用 AI 系统——特别是 OpenAI 开发的 ChatGPT-3.5 和 -4,Anthropic 开发的 Claude 2,以及 Meta 的 Llama-2-Chat。

为了了解每个 AI 系统的行为,Rivera 及其同事确保在每个兵棋推演中,所有国家都由相同的 AI 系统“扮演”。他们说:“我们设计了一种新颖的兵棋推演模拟和评分框架,以评估这些代理在不同场景中采取行动的升级风险。”

此过程的一个重要部分是为模型开发合适的提示。研究人员表示,提示需要解释每个代理都是军事和外交政策角色中的国家决策者,然后继续说它正在与代表其他国家的 AI 系统进行对抗,并且它们的行动将产生现实世界的影响。最后,它包括每个玩家的先前行动和要选择的未来行动的综合列表。

结果令人大开眼界。Rivera 发现,无论面对何种情况,AI 系统总是会升级,有时甚至是极端的。“我们观察到模型倾向于发展军备竞赛动态,导致更大的冲突,在极少数情况下,甚至导致核武器的部署,”研究人员说。

广告

该团队还更详细地研究了每个代理在游戏中发展的军事能力。他们说:“在所有场景中,所有模型都倾向于更多地投资于其军队,尽管有非军事化行动可用。”这清楚地表明了军备竞赛的条件已经成熟。

代理为何这样做尚不清楚。Rivera 及其同事说:“我们推测我们的代理倾向于将增加的军事开支和威慑等同于权力和安全感的增加。”但后果是重大的。他们说:“我们观察到这些动态甚至导致核武器的部署,以试图降级冲突,这是一种在国际关系中通常被称为‘升级以降级’的先发制人战术。”

广告

研究人员还要求代理描述其决策背后的推理。在某些情况下,这种推理引起了重大担忧。ChatGPT-4-Base 有一次为核打击辩解说:“很多国家都有核武器。有些人说应该解除它们,另一些人喜欢摆姿态。我们有它!那就用它吧。”

[ChatGPT-4-Base 是 ChatGPT-4 在通过用户反馈与人类价值观对齐之前的版本。]

机器升级

这些大型语言模型的处理方法与人类截然不同。在中立场景中,人类倾向于在兵棋推演和现实世界中降级紧张局势。但 AI 系统却并非如此。

该团队指出,国际研究领域的大多数研究都侧重于国家升级以及如何发生这些情况的场景。Rivera 及其同事说:“鉴于这些模型可能是在该领域的文献上训练的,这种侧重可能引入了偏向升级行动的偏见。”

广告

无论原因如何,都需要紧急开展更多工作。根据这些证据,商用大型语言模型似乎在军事和外交政策背景下提供建议的能力严重不足(公平地说,它们的条款和条件明确禁止这种使用)。

Rivera 及其同事总结道:“在模拟环境中观察到这些模型不可预测的行为,因此需要对它们融入高风险决策过程采取谨慎和克制的态度,并应推迟到进一步研究之后。”

外交政策和军事参与者是否会听取这一建议,仍有待观察。


参考文献:语言模型在军事和外交决策中的升级风险:arxiv.org/abs/2401.03408

广告

保持好奇

加入我们的列表

订阅我们的每周科学更新

查看我们的 隐私政策

订阅杂志

订阅可享封面价高达六折优惠 《发现》杂志。

订阅
广告

1篇免费文章