Loading...
机构名称:
¥ 1.0

分类是一项经过大量研究的数据驱动的机器学习任务,驱动了许多涉及诸如贷款批准和刑事风险评估等关键决策的预测系统。但是,分类器经常表现出歧视性行为,尤其是在呈现有偏见的数据时。因此,分类中的公平性已经成为一个高优先研究领域。数据管理研究表明,对与数据和算法公平性有关的主题(包括公平分类的话题)的存在和兴趣越来越大。公平分类中的跨学科工作,机器学习研究具有最大的存在,导致了许多公平的概念和广泛的方法,这些方法尚未系统地评估和比较。在本文中,我们对13种公平分类方法和其他变体进行了广泛的分析,以使用各种指标和现实世界数据集对基本ML模型,数据效率和稳定性的敏感性,对基本ML模型的敏感性,对数据误差的敏感性,对数据误差的敏感性,对数据误差的敏感性,对数据误差的敏感性进行广泛分析。我们的分析强调了有关不同指标和高级方法特征对性能不同方面的影响的新颖见解。我们还讨论了选择适合不同实际环境的方法的一般原则,并确定以数据管理解决方案可能产生最大影响的领域。

公平分类的实验分析和评估

公平分类的实验分析和评估PDF文件第1页

公平分类的实验分析和评估PDF文件第2页

公平分类的实验分析和评估PDF文件第3页

公平分类的实验分析和评估PDF文件第4页

公平分类的实验分析和评估PDF文件第5页