罗素的工作旨在确保人类和越来越有能力的AI系统的安全和有益共存。罗素(Russell)创造的核心问题是图灵,维纳(Wiener),明斯基(Minsky)和博斯特罗姆(Bostrom)等:一种功能强大的优化器,其目标与“人类的最大利益”不一致可能导致不可逆转的局势,在这种情况下,这些利益不再持续下去。Russell的解决方案是从他先前引入反向加固学习中借用的,它是自1950年代以来绝大多数AI研究的核心假设:假设AI系统具有固定的优化目标。这个假设是为解决问题,计划,MDP,强化学习等所有工作的基础,因为AI进入了真实的开放式世界。Russell提出,AI应作为“援助游戏”,其中AI系统的唯一目标是进一步的人类利益,但明确不确定这些利益是什么。关键结果是援助游戏求解器对人类非常有益。通过他的书《人类兼容》,《 BBC Reith讲座》和许多其他出版物,罗素一直是建立AI安全领域的领先人物。
主要关键词