Loading...
机构名称:
¥ 1.0

操纵是社交媒体、广告和聊天机器人等许多领域关注的问题。随着人工智能系统越来越多地介入我们的数字互动,了解人工智能系统在多大程度上可能在系统设计者不知情的情况下操纵人类变得非常重要。我们的工作阐明了定义和衡量人工智能系统操纵的挑战。首先,我们以先前关于操纵的文献为基础,描述了可能的操纵概念空间,我们发现这些概念取决于动机、意图、隐蔽性和伤害等概念。我们回顾了如何操作每个概念的提案,并概述了将每个概念纳入操纵定义所面临的挑战。其次,我们讨论了操纵与相关概念(如欺骗和胁迫)之间的联系。然后,我们分析了我们对操纵的描述如何应用于推荐系统和语言模型,并简要概述了其他领域的操纵监管。虽然在定义和衡量人工智能系统的操纵方面取得了一些进展,但仍存在许多差距。由于缺乏统一的定义和可靠的测量工具,我们不能排除人工智能系统在系统设计者不知情的情况下学会操纵人类的可能性。操纵可能对人类自主性构成重大威胁,因此有必要采取预防措施来减轻这种威胁。

描述人工智能系统的操控行为

描述人工智能系统的操控行为PDF文件第1页

描述人工智能系统的操控行为PDF文件第2页

描述人工智能系统的操控行为PDF文件第3页

描述人工智能系统的操控行为PDF文件第4页

描述人工智能系统的操控行为PDF文件第5页

相关文件推荐