早在2023年2月,国际律师事务所安理环球(Allen & Overy)就为其律师提供了AI聊天机器人,以帮助他们起草合同。几乎立即,该AI系统就开始为该公司在该地区工作的3500名律师每周节省约2小时。同年晚些时候,该公司宣布推出一项能够进行合同谈判的AI系统,每次谈判可节省高达7小时。
但真正不太清楚的是,这些节省的实际意义有多大。特别是,在起草或审查合同等标准任务中,大型语言模型的表现与初级律师相比如何。
AI对决人类
现在,得益于法律科技公司Onit的AI卓越中心(AI Center of Excellence)的Lauren Martin及其同事的研究,我们得到了一种答案。Martin及其团队直接对比了初级律师和大型语言模型的工作,并表示机器的表现明显优于人类同行。“大型语言模型有望颠覆法律行业,提高法律服务的可及性和效率,” Martin及其同事表示。
该团队通过要求资深律师指出一套真实世界采购合同中的重要法律问题,然后让大型语言模型和初级律师评估同一批合同,从而得出这一结论。
结果令人大开眼界。像Claude和GPT-4这样的大型语言模型在识别法律问题方面,其精确度与人类相当甚至更高。但在指出合同中与这些问题相关的具体部分时,AI的表现略逊于人类。
但在速度方面,对比则令人震惊。最快的大型语言模型在不到一分钟内就完成了合同审查,而初级律师平均需要56分钟。
Martin及其同事表示,这还不包括训练AI系统所需的约16小时。但他们指出,这段时间大致相当于指导初级律师完成相同任务所需的时间。“这种准备时间的等同性挑战了‘大型语言模型的速度优势被其设置要求所抵消’的说法,” Martin及其同事表示。
潜在的成本节约同样是巨大的。“虽然初级律师每次合同审查的平均成本为74美元,但最快的大型语言模型执行相同任务的成本仅约为2美分,”他们说。
谨慎推进
“这对法律行业的影响是深远的和多方面的,”研究人员说,初级律师可能会在职业生涯早期承担更多高价值的工作,而常规任务更有可能分配给AI系统。
但并非一切都尽善尽美。该分析警告说,AI在细微的法律理解方面仍不如人类。模型也可能“幻觉”,即提出合同中不存在的问题。因此,经验丰富的律师的监督仍然至关重要。
仍需进行大量工作来评估大型语言模型在更多司法管辖区和更多合同类型中的表现。但这项研究清楚地揭示了AI在核心法律任务中的可行性。法律正在迅速改变,正如安理环球(Allen & Overy)已经展示的那样。这项由法律科技公司Onit资助的研究,为此提供了一些量化数据。机器人律师的时代显然已经到来。
参考:Better Call GPT,将大型语言模型与律师进行比较:https://arxiv.org/abs/2401.16212
此帖在Claude.AI的协助下准备














