AI工具有时比人类律师更好 - 学习

一项针对法律AI工具的新基准测试研究,其中包括八月,括号,GC AI和Simpledocs,发现‘遇到或超过了几种AI工具...

来源:Artificial Lawyer

一项针对法律AI工具的新基准测试研究,其中包括八月,括号,GC AI和SimpleDocs,发现与人类律师相比,“几种AI工具达到或超过了合同起草的预期绩效基线”。

通过LegalBenching.ai使用了一组经验丰富的律师组,该研究“基准在合同起草中基准和AI”。结果(见下文)通过三个主要维度进行评估:有用性,可靠性和AI平台提供的总体支持,例如解决方案如何支持合同的起草。

LegalBench Marked.ai

这是关键发现:

    ‘AI工具匹配,在某些情况下,律师在生产可靠的初稿方面优于律师。 人类在56.7%的任务中是可靠的,但是几种AI工具达到或超过了这一基线。最高的AI工具极大地超过了顶级人类。 最高的人类律师在70%的时间里生产了可靠的初稿,而AI顶级工具的最高初稿的时间为73.3%。 在具有高可执行性或合规风险的起草场景中,法律AI工具更有可能行使法律判断,从而提高了83%的产出中的明确风险警告,而通用AI工具则为55%。相比之下,人类没有提出。规范化的法律AI工具在输出可靠性和实用性方面都没有有意义地超过通用AI工具。 通用AI解决方案的输出可靠性略有优势(58.3%比57.6%),而法律AI解决方案在输出有用性上得分略高。平台工作流支持是专用工具的关键区别,而不是输出性能。 我们测试的解决方案中有三分之二(66.7%)集成到Microsoft Word,这是律师的主要工作环境,大多数还提供了上下文处理功能,而大多数通用AI工具缺乏的功能。
顶部AI工具的表现略优于顶部人类。

-