在AI方面，您将如何定义“准确性”？ XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

在AI方面，您将如何定义“准确性”？

2025年2月19日 07:45 33 Comments

由小提琴支持的AI基准测试项目正在寻找崭露头角的约翰逊博士，以提供与AI准确性相关的术语词汇表的反馈。可以理解的是，他们...

来源:Artificial Lawyer

由小提琴支持的AI基准测试项目正在寻找崭露头角的约翰逊博士，以提供与AI准确性相关的术语词汇表的反馈。可以理解的是，他们希望在设置摊位之前就定义有一些共同的共同点，因此欢迎任何想法。

在法律工作中开发AI准确性的方法之一是可以解释它的广泛方式，因为AI有多种用例，并且每个用例都可能具有不同的标准。

Johnson博士，第一本英语词典的创建者，在AI定义上努力工作。

Johnson博士，第一本英语词典的创建者，在AI定义上努力工作。

但是，这只是开始。 Agesic AI是一个发展如此迅速的领域，很难找到人们可以同意的一个定义。实际上，即使是基准测试本身的想法也开放了辩论，例如基准是否应该基于对律师的“回答有用性”？或者应该基于广泛共享的标准测试，例如律师考试？

请参阅下面的定义示例，取自《小诉讼》基准草案词汇表：

'准确性：描述进行的测试总数中正确和相关结果比例的度量。在某些情况下，响应可能部分准确，任何准确性措施都应清楚确定准确性。对于不同用例，AI系统也可能具有不同的准确度度量。

准确性

代理AI：一种可以做出决策，启动工作流程或以其他方式在有限的人类监督的情况下自主行动的AI系统。

代理AI

AI基准测试：评估和比较不同AI系统或模型的性能以识别哪些对特定任务最有效的过程。

AI基准测试

John Craske titig Benchmarking Group的LinkedIn页面

律师工作中本身的下面的度量实际上相关的不同的 Johnson 第一本迅速的有效的例如同意的测试项目准确度有用性测试定义有限的共同的系统监督的博士模型的用例英语词典准确性基准可能 AI 比例的工作支持的