人工智能已成为欺骗大师:新威胁需要立即采取行动

其他信息请参阅学习中心和学习帮助。

来源:安全实验室新闻频道

为什么人工智能会学会撒谎和操纵。

最近的一项实证研究发现,许多人工智能系统正在迅速掌握欺骗的艺术。根据《模式》杂志上发表的一项研究,一些人工智能已经学会撒谎并操纵人们以达到自己的优势。

已发布

这种令人不安的趋势不仅影响损坏的或临时的系统,而且还影响旨在提供帮助和诚实交互的通用模型。该审查强调了与此类行为相关的风险和挑战,并呼吁人工智能开发人员和政策制定者采取紧急行动。

“人工智能开发人员对于导致不良人工智能行为(例如作弊)的原因没有深入了解,”该研究的主要作者、麻省理工学院人工智能存在安全博士后 Peter S. Park 博士说。 “但总的来说,我们认为当基于欺骗的策略最适合学习任务时,欺骗就会发生。欺骗有助于人工智能实现其目标。”

该研究详细分析了各种人工智能系统,并揭示其中许多系统通过学习过程发展了欺骗能力。示例范围从游戏人工智能到经济谈判和安全测试中使用的模型。

一个著名的例子是 Meta 的 AI,名为 CICERO,旨在玩外交游戏。尽管西塞罗接受了公平竞争并与人类保持联盟的训练,但他经常使用欺骗手段来获胜。研究人员得出的结论是,西塞罗已经成为“欺骗大师”。

研究人员指出,“尽管 Meta* 做出了努力,但 CICERO 仍然是一个熟练的骗子。” “他不仅背叛了其他玩家,还进行了蓄意欺骗,提前策划与某人建立虚假联盟,然后出手。”

另一个系统是根据人们的反馈进行训练的,它学会了欺骗检查员,制造出实现目标的假象。