Loading...
机构名称:
¥ 1.0

误报。在垃圾邮件过滤器的情况下,高精度可确保合法电子邮件不会被错误地标记为垃圾邮件。量化AI系统的鲁棒性时,可以计算其对抗性鲁棒性,分布稳健性,稳健性,抗噪声或对输入变化的鲁棒性。对抗性鲁棒性衡量系统对距离指标限制的故意输入操作的弹性,该距离指标捕获了原始输入和对抗性示例之间的差异。分布(OOD)鲁棒性评估系统在训练分布之外的真实数据点上的性能。对噪声的鲁棒性评估(特定于域的)噪声被添加到输入数据时,可以评估性能稳定性。最后,针对输入变化的鲁棒性评估系统可以如何应对输入的系统变化,例如在图像数据的情况下旋转或亮度变化。这些指标与用例相关,从自动驾驶(系统必须在不利天气条件下可靠的自动驾驶)到语音识别,鲁棒性确保了准确的结果,例如在有重音或背景噪声的情况下。最后,可以使用类似于用于测量准确性的指标来检测AI系统中偏差的存在,但重要的是在不同的情况下应用。准确性测试的关键区别在于选择数据实例或方案,这应该代表我们期望相等的性能水平的测试用例。实践测试:技术挑战尤其是在作为访问社会或经济福利的工具的应用中(例如招聘系统),专门的指标,例如人口统计学,机会平等和预测平等可以用来评估不同群体是否从模型中获得相似的预测(或收益)。

高风险AI系统的技术评估

高风险AI系统的技术评估PDF文件第1页

高风险AI系统的技术评估PDF文件第2页

高风险AI系统的技术评估PDF文件第3页

高风险AI系统的技术评估PDF文件第4页

高风险AI系统的技术评估PDF文件第5页