在AI方面,您将如何定义“准确性”?

由小提琴支持的AI基准测试项目正在寻找崭露头角的约翰逊博士,以提供与AI准确性相关的术语词汇表的反馈。可以理解的是,他们...

来源:Artificial Lawyer

由小提琴支持的AI基准测试项目正在寻找崭露头角的约翰逊博士,以提供与AI准确性相关的术语词汇表的反馈。可以理解的是,他们希望在设置摊位之前就定义有一些共同的共同点,因此欢迎任何想法。

在法律工作中开发AI准确性的方法之一是可以解释它的广泛方式,因为AI有多种用例,并且每个用例都可能具有不同的标准。

Johnson博士,第一本英语词典的创建者,在AI定义上努力工作。
Johnson博士,第一本英语词典的创建者,在AI定义上努力工作。
Johnson博士,第一本英语词典的创建者,在AI定义上努力工作。

但是,这只是开始。 Agesic AI是一个发展如此迅速的领域,很难找到人们可以同意的一个定义。实际上,即使是基准测试本身的想法也开放了辩论,例如基准是否应该基于对律师的“回答有用性”?或者应该基于广泛共享的标准测试,例如律师考试?

请参阅下面的定义示例,取自《小诉讼》基准草案词汇表:

'准确性:描述进行的测试总数中正确和相关结果比例的度量。在某些情况下,响应可能部分准确,任何准确性措施都应清楚确定准确性。对于不同用例,AI系统也可能具有不同的准确度度量。

准确性

代理AI:一种可以做出决策,启动工作流程或以其他方式在有限的人类监督的情况下自主行动的AI系统。

代理AI

AI基准测试:评估和比较不同AI系统或模型的性能以识别哪些对特定任务最有效的过程。

AI基准测试

-

John Craske titig Benchmarking Group的LinkedIn页面

-