如今,由于复杂模型(例如深神经网络工作(DNN))和众多大规模数据集的收集,机器学习模型在许多领域都取得了显着突破。机器学习模型越来越多地用于与最终用户相互作用的现实应用程序中,例如医疗保健,推荐系统,刑事司法,招聘等[53]。最近的研究表明,这些机器学习模型可能对某些人口统计学表现出歧视行为。例如,皮肤较深的女性的错误率(高达34.7%)远高于皮肤较轻的男性(高达34.7%)[5]。这种戏剧性的准确性差异可能会对肤色较暗的女性造成重大损害。同样,基于AI的科技公司的招聘工具通过用关键词“女性”来惩罚简历来表现出对妇女的歧视。现实世界中AI系统的偏见和不公平行为可能会对个人和我们的社会造成重大伤害。因此,学术界和行业都在解决不公平的问题方面存在着增长的兴趣[59,63,19]。
主要关键词