多语言法律人工智能需要数据,而不仅仅是更好的模型

作者:Michael Krallmann,TransLegal 首席执行官。对于法律技术界来说,跨司法管辖区的含义引发了风险、责任和信任问题。功能日益强大的模型,包裹着复杂的......

来源:Artificial Lawyer

作者:Michael Krallmann,TransLegal 首席执行官。

对于法律科技界来说,跨司法管辖区的含义引发了风险、责任和信任问题。能力越来越强的车型,包裹着精良的产品,在跨界环境下仍然会遭遇失败。虽然本能反应是寻找更好的模型,但真正的限制在其他地方。

仅有更好的模型是不够的

多语言法律AI不会因为模型不够强大而失败。它失败了,因为他们无法访问显示法律概念如何跨系统实际运作的数据。法律意义不是普遍的,是文化、宗教、历史、教义、程序和制度发展的产物。如果没有结构化地接触司法环境和差异,即使是最强大的模型也会默认在其训练数据中占主导地位。

普遍的信念似乎是规模和概括将解决管辖权差异,拥有足够的文本将使模型能够推断出必要的区别。然而,在实践中,许多最重要的差异是微妙的、记录不足的或通过实践而不是明确的定义来表达的。换句话说,它们需要解释,而不是模式匹配。

准确数据作为法律基础设施

如果处理得当,比较法分析不仅仅是一种释义练习。相反,它确定了目的、范围、法律效力和限制,承认部分等同和不等同,尤其是明确指出了明显正确的翻译在哪里出现问题。由于此类数据不会自动从大型语料库中产生,因此必须刻意创建它们。

这种数据构建很少在商业环境中进行,因为它缓慢、昂贵且难以扩展。然而,正是这些数据决定了人工智能系统在多语言法律环境中是否可信。

降低风险并获取真正价值

寻求解决方案