数据塑造了我们目前所知的人工智能 (AI) 的发展,多年来,集中式网络基础设施主导着这些数据的来源和后续使用。研究表明,集中式方法的表示效果不佳,而随着人工智能现在越来越多地融入日常生活,需要努力改进这一点。人工智能研究界已开始探索以更民主的方式管理数据基础设施,发现分散式网络可以实现更高的透明度,从而可以缓解选择偏差等核心伦理问题。考虑到这一点,我们在此围绕人工智能中的数据表示和数据基础设施进行了一项小型调查。我们概述了与数据驱动人工智能相关的四个关键考虑因素(审计、基准测试、信心和信任、可解释性和可解释性),并提出对它们的反思以及改进的跨学科讨论可能有助于缓解基于数据的人工智能伦理问题,并最终改善与人工智能交互时的个人福祉。
主要关键词