广告

DeepMind 如何利用人工智能“解决”足球问题

继围棋、国际象棋和蛋白质折叠之后,这家世界上最著名的 AI 公司正在挑战一项独特的人类运动。

Google NewsGoogle News Preferred Source
图片来源:Sergey Nivens/Shutterstock

新闻简报

注册我们的电子邮件新闻简报,获取最新的科学新闻

注册

谷歌旗下较著名的子公司之一是其人工智能部门 Deepmind。这家总部位于伦敦的公司在 2013 年凭借一台能够学习玩 Pong 和 Breakout 等传统视频游戏,并迅速达到超人表现的机器,在人工智能研究领域掀起了风暴。

广告

这预示着一系列令人印象深刻的进展。其中最主要的是 AlphaGo 机器,它在古老的中国围棋游戏中达到了超人水平。最近,它的 AlphaFold 机器在解决长期存在的蛋白质折叠问题方面超越了所有其他方法。

因此,一个有趣的问题是,该公司接下来将解决什么问题。

现在我们有了答案。Deepmind 创建了一个智能代理,它学会了如何踢足球。不仅是铲球、传球和团队配合等高水平技能,还包括如何以像人类一样的方式控制一个完全铰接的人体来执行这些动作。结果是一个令人印象深刻的足球模拟,让人联想到人类球员,尽管这些球员还很稚嫩和笨拙。

Deepmind 的 Siqi Liu 和同事描述了这种方法。第一个任务是让智能代理完全控制一个拥有所有关节和铰接的类人型角色——一个真实人类拥有的 56 个自由度。

代理在一个模拟环境中学习控制这个类人型角色,其中内置了普通的重力和其他物理定律。它通过学习复制通过标准动作捕捉技术捕捉到的真实足球运动员的动作来做到这一点。这些动作包括跑步、变向、踢球等等。然后,AI 类人型角色练习运球、跟球和射门等中级技能。最后,类人型角色进行 2 对 2 的比赛,第一个进球的队伍获胜。

这个过程令人印象深刻的成果之一是,类人型角色学会了各种战术。刘和同事说:“它们培养了对他人的意识,并学会了团队合作,成功地弥合了毫秒级低级运动控制与数十秒级团队协调的以目标为导向的行为之间的差距。” 这些比赛的录像以及球员的学习方式都可以在网上找到。

这项工作的突出之处在于 Deepmind 同时应对这些挑战,而在过去,这些挑战通常是分开解决的。这很重要,因为球员的突发行为主要取决于他们的敏捷性和自然运动,这表明了结合这些方法的优势。该团队表示:“结果表明,人工智能代理确实可以学习协调复杂的运动,以便与物体互动,并与其他代理合作实现长期目标。”

有趣的是,球员学会了传球,但似乎没有学会跑位。这可能是因为跑位通常需要球员跑离球。如果缺乏这种能力,比赛模式就会让人想起小孩子,他们倾向于一群人追逐球。

广告

大一点的孩子会发展出空间感,而成年球员在比赛的大部分时间里都在跑位或封堵对方球员可能跑位的空间,所有这些都是在没有球的情况下进行的。

但 Deepmind 的方法仍处于起步阶段,有很大的发展潜力。下一步显而易见的步骤是进行更大规模的团队比赛,并观察会产生什么样的行为。研究人员说:“更大规模的团队也可能导致更复杂战术的出现。”

广告

机器人策略

Deepmind 还大大简化了足球规则——没有界外球,没有点球,没有专门的守门员。这需要为 AI 类人型机器人进行一些训练,以掌握所需的新技能,但也可能导致不同打法的发展。

Deepmind 为什么会对这种看似无关紧要的追求感兴趣呢?答案可能是为了更好地理解如何使用人工智能解决具有复杂运动策略的现实世界问题。刘和同事说:“我们相信,基于模拟的研究可以帮助我们理解计算原理的各个方面,这最终可能使我们能够在现实世界中产生类似的行为。”

而且在此过程中可能会有一些奖项可获得。首先是 RoboCup 项目,其中人形机器人团队相互踢足球。比赛缓慢、生硬且滑稽。因此不难想象 Deepmind 的模拟将成为机器人足球领域的一股强大力量。

然后是游戏的潜力。也许可以让人类对球员的行为进行一些控制,就像当前的 FIFA 足球视频游戏一样。甚至有可能使用动作捕捉技术将人类融入到这些模拟游戏中。

广告

最后,有可能 11 对 11 的模拟会比人类比赛更先进。AlphaGo 在围棋中发现了全新的下棋策略,而围棋已经有几个世纪的历史。难道不能想象 Deepmind 会为足球发现新的战术和比赛计划吗?考虑到它在其他领域的记录,排除这种可能性是愚蠢的。

参考文献:从运动控制到模拟人形足球中的团队配合:arxiv.org/abs/2105.12196

保持好奇

加入我们的列表

订阅我们的每周科学更新

查看我们的 隐私政策

订阅杂志

订阅可享封面价高达六折优惠 《发现》杂志。

订阅
广告

1篇免费文章