详细内容或原文请订阅后点击阅览
Ivo 建议 Claude For Word 很弱
合同智能平台 Ivo 进行了一项经典的人工智能与人类测试,但这一次将 Claude for Word 作为竞争对手。它...
来源:Artificial Lawyer合同智能平台 Ivo 进行了一项经典的人工智能与人类测试,但这一次将 Claude for Word 作为竞争对手。它击败了人类法学硕士,并接近击败人类律师。事实上,他们认为克劳德在合同审查方面确实很弱——至少是“开箱即用”。
评估人工智能驱动的合同审查绩效的“独立第三方基准”的结果为(满分 10 分):
Ivo 联合创始人兼首席执行官 Min-Kyu Jung 评论道:“我们设计这个基准的目的是通过将真实的工具与真实的工作进行对比,并由真正的律师进行评判,从而改变这一现状。”正在出现的并不是律师的替代品,而是一种扩展高质量法律工作的新方式,其中人工智能处理可重复的任务,法律团队可以专注于策略、谈判和客户结果。”
那么,它是如何工作的呢?
他们解释说,这项研究旨在回答法律团队正在积极争论的一个问题:像 Claude for Word 这样的通用人工智能工具能否与真实合同工作流程中专门构建的法律系统的性能相匹配?
该研究于 2026 年 4 月进行,比较了 Ivo、Claude for Word (Opus 4.6) 以及 AmLaw 25 公司的执业特别顾问 19 份真实的匿名合同。
三名评委通过盲审对结果进行评分,他们都是近期在 Am Law 100 律所工作或担任科技公司内部法律顾问经验的技术交易律师。
这有什么大不了的吗?
AL 不得不说,没有一个分数看起来令人惊叹……。
....但人类做得最好是件好事,尽管不是很多。可怜的老克劳德(Claude)的 Word 成绩只有 3.5(满分 10)。达里奥(Dario)不会对此感到高兴。
当然,这只是一个实验。根据许多因素和不同的参数,性能可能会以多种方式发生变化。
我们学到了什么?
“下一部分是弥合人工智能能力与律师对法律人工智能输出的信任之间的差距。
—
以及,
