模拟物质在原子尺度上行为的能力正在彻底改变材料科学及其相关的一切。这种方法正在产生具有奇特性能的新材料、用于核能的坚固合金,以及对蛋白质折叠的新认识,这仅仅是其中一些应用。
这些进步在很大程度上得益于日益强大的计算机器,其目标是使模拟更大、更快、更持久。
这是目标,但现实情况更为复杂。更强大的计算机使研究人员能够模拟包含数万亿原子的巨大物质团块。但即使是世界上最强大的百亿亿次(exascale)计算机,一个月也只能产生几微秒的模拟时间。
更糟糕的是,增加更多的中央处理器(CPU)帮助不大。这是因为这些芯片之间传输信息所需的时间是这些计算的瓶颈。增加更多的芯片只会使这个瓶颈更加严重。
原子影响
现在,这一切都因加州芯片制造商 Cerebras Systems 的 Kylee Santos 以及桑迪亚国家实验室、劳伦斯利弗莫尔国家实验室和洛斯阿拉莫斯国家实验室的科学家的工作而改变。这个团队找到了一种将原子尺度模拟速度提高两个数量级的方法,其结果可能对材料科学产生变革性影响。
芯片之间互连引入的时间延迟是最大规模计算中一个众所周知的问题,其中数万个芯片必须连接在一起。
这些芯片通常有很多核心,每个核心都可以独立于其他核心进行计算。事实上,高端桌面中央处理器(CPU)通常有几十个核心。最大的优势是,由于所有核心都雕刻在同一块硅片上,它们可以快速交换数据。
Cerebras 的成立是为了消除芯片制造中的一个奇特现象。硅芯片最初是纯硅圆片,每片大约有一个大餐盘那么大。这些晶圆上承载着几十个或几百个芯片,具体取决于它们的大小。在制造过程的最后,晶圆被分成单独的芯片,然后单独出售。
但在超级计算机中,芯片必须重新连接起来,以便它们可以交换数据。Cerebras 的大想法是将整个硅晶圆变成一个巨大的芯片,该公司称之为“晶圆规模引擎”。最大的好处是,在这些晶圆内部,所有核心都可以高速通信。
结果是一个非凡的芯片。该公司名为“晶圆规模引擎-2”(Wafer-Scale Engine-2,WSE-2)的芯片是一个单一芯片,拥有 850,000 个核心,带有 40GB 片上内存和每秒 20PB 的内存带宽。所有这些都消耗 23 千瓦的电力——仅用于一个芯片!
正是这台机器,Santos 和同事们利用它来模拟物质的行为。该团队使用每个核心来模拟材料中的一个原子,该材料包含超过 800,000 个原子。这相当于大约 60 x 60 x 2 纳米大小的薄片。
晶界
材料科学中的一个关键问题是如何理解金属晶体与相邻晶体在不同取向时如何相互作用。这些所谓的晶界很复杂,因为虽然原子在晶体内部排列完美,但在晶界处,它们的排列更复杂,并且会随着时间变化。
模拟需要考虑在飞秒尺度上发生的原子振动,同时模拟在微秒尺度上出现的物理和化学变化,例如原子相对于其邻居位置的变化。这是九个数量级的尺度差异。因此,实现更长的模拟时间至关重要。
现在 Santos 和同事们已经为铜、钨和钽实现了这一点,并且进一步的进步看起来显而易见。Santos 和同事们说:“通过为每个模拟原子分配一个处理器核心,我们实现了每秒时间步长 179 倍的改进。”这使得在一天内就能实现传统百亿亿次计算机 6 个月运行时间的等效性能。
Santos 和同事们表示,当将其应用于材料科学的开放性问题时,这将带来巨大的回报。他们说:“将每年的运行时间缩短到两天,就可以解锁目前无法实现的、对理解材料行为和功能至关重要的缓慢微观结构转变过程的时间尺度。”
“我们的工作表明,新型晶圆规模计算机架构可以显著提高复杂原子系统的最大模拟速率。”
预计很快还将有更多进展。目前的工作使用了 Cerebras 公司于 2021 年发布的 WSE-2 晶圆。今年早些时候,该公司推出了专为人工智能应用设计的 WSE-3。其功能值得密切关注。
参考:使用晶圆规模系统突破分子动力学时间尺度障碍:arxiv.org/abs/2405.07898














