研究人员称：AI律师与人类律师不相上下

早在2023年2月，国际律师事务所安理环球（Allen & Overy）就为其律师提供了AI聊天机器人，以帮助他们起草合同。几乎立即，该AI系统就开始为该公司在该地区工作的3500名律师每周节省约2小时。同年晚些时候，该公司宣布推出一项能够进行合同谈判的AI系统，每次谈判可节省高达7小时。

但真正不太清楚的是，这些节省的实际意义有多大。特别是，在起草或审查合同等标准任务中，大型语言模型的表现与初级律师相比如何。

AI对决人类

现在，得益于法律科技公司Onit的AI卓越中心（AI Center of Excellence）的Lauren Martin及其同事的研究，我们得到了一种答案。Martin及其团队直接对比了初级律师和大型语言模型的工作，并表示机器的表现明显优于人类同行。“大型语言模型有望颠覆法律行业，提高法律服务的可及性和效率，” Martin及其同事表示。

该团队通过要求资深律师指出一套真实世界采购合同中的重要法律问题，然后让大型语言模型和初级律师评估同一批合同，从而得出这一结论。

结果令人大开眼界。像Claude和GPT-4这样的大型语言模型在识别法律问题方面，其精确度与人类相当甚至更高。但在指出合同中与这些问题相关的具体部分时，AI的表现略逊于人类。

但在速度方面，对比则令人震惊。最快的大型语言模型在不到一分钟内就完成了合同审查，而初级律师平均需要56分钟。

Martin及其同事表示，这还不包括训练AI系统所需的约16小时。但他们指出，这段时间大致相当于指导初级律师完成相同任务所需的时间。“这种准备时间的等同性挑战了‘大型语言模型的速度优势被其设置要求所抵消’的说法，” Martin及其同事表示。

潜在的成本节约同样是巨大的。“虽然初级律师每次合同审查的平均成本为74美元，但最快的大型语言模型执行相同任务的成本仅约为2美分，”他们说。