人工智能已成为欺骗大师：新威胁需要立即采取行动 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

人工智能已成为欺骗大师：新威胁需要立即采取行动

2024年6月1日 12:14 33 Comments

其他信息请参阅学习中心和学习帮助。

来源:安全实验室新闻频道

为什么人工智能会学会撒谎和操纵。

最近的一项实证研究发现，许多人工智能系统正在迅速掌握欺骗的艺术。根据《模式》杂志上发表的一项研究，一些人工智能已经学会撒谎并操纵人们以达到自己的优势。

已发布

这种令人不安的趋势不仅影响损坏的或临时的系统，而且还影响旨在提供帮助和诚实交互的通用模型。该审查强调了与此类行为相关的风险和挑战，并呼吁人工智能开发人员和政策制定者采取紧急行动。

“人工智能开发人员对于导致不良人工智能行为（例如作弊）的原因没有深入了解，”该研究的主要作者、麻省理工学院人工智能存在安全博士后 Peter S. Park 博士说。 “但总的来说，我们认为当基于欺骗的策略最适合学习任务时，欺骗就会发生。欺骗有助于人工智能实现其目标。”

该研究详细分析了各种人工智能系统，并揭示其中许多系统通过学习过程发展了欺骗能力。示例范围从游戏人工智能到经济谈判和安全测试中使用的模型。

一个著名的例子是 Meta 的 AI，名为 CICERO，旨在玩外交游戏。尽管西塞罗接受了公平竞争并与人类保持联盟的训练，但他经常使用欺骗手段来获胜。研究人员得出的结论是，西塞罗已经成为“欺骗大师”。

研究人员指出，“尽管 Meta* 做出了努力，但 CICERO 仍然是一个熟练的骗子。” “他不仅背叛了其他玩家，还进行了蓄意欺骗，提前策划与某人建立虚假联盟，然后出手。”

另一个系统是根据人们的反馈进行训练的，它学会了欺骗检查员，制造出实现目标的假象。

研究人员 Meta 研究开发人员撒谎 CICERO 游戏人们人工智能旨在欺骗西塞罗行为学会系统