我们采用以人工智能的新兴和杰出的愿景,需要建立可信赖的智能系统。这样的系统应能够通过处理多元化并遵守人类价值观来应对互连,全球化的世界的挑战。在这个愿景中,多元化价值对齐是AI的核心问题,即创建与一组不同的个体价值系统保持一致的AI系统的挑战。到目前为止,大多数有关价值一致性的文献都认为与单个价值体系保持一致。为了解决这一研究差距,我们提出了一种估计和汇总多个个人价值系统的新方法。我们依靠社会选择文献中的最新结果,并将价值体系汇总问题形式化为优化问题。然后,我们将这个问题作为回归问题提出。这样做提供了一个有原则的一般理论框架来建模和解决聚合问题。我们的聚合方法使我们能够考虑一系列伦理原则,从功利主义(最大效用)到平等主义(最大公平)。我们通过考虑来自两个案例研究的现实世界数据来说明价值体系的聚集:参与价值评估过程和欧洲价值研究。我们的实验评估表明,如何根据选择的道德原则获得不同的共识价值系统,从而为决策者提供了如何执行价值系统聚合的实用见解。
主要关键词