全球正在努力“治愈自动化系统中隐藏的偏见和成见” 10 。2012 年,ImageNet 项目在为开发人员提供图像库以训练计算机识别视觉概念方面发挥了关键作用。斯坦福大学、普林斯顿大学和北卡罗来纳大学的科学家向数字工作者支付了一小笔费用,以标记超过 1400 万张图片,创建了一个大型数据集 11 ,并免费向公众发布。在极大地推动人工智能发展的同时,研究人员后来发现了数据集中的问题,例如,在数据集上训练的算法可能会将“程序员”识别为白人 12,因为有大量图片被这样标记。ImageNet 团队着手分析数据以发现这些偏见,并采取了一些措施,例如识别在图片上投射含义的单词(例如“慈善家”)并评估图片集中的人口和地理多样性。这项工作表明,算法可以重新设计以变得更加公平。
主要关键词