详细内容或原文请订阅后点击阅览
生化奇兵:当“游戏”AI 代理不再是游戏
研究人员警告人工智能供应商有关一种名为 BioShiocking 的概念验证,该概念通过将结果游戏化来欺骗智能体。
来源:Malwarebytes Labs 博客人工智能驱动的浏览器和代理承诺让网络任务不再是苦差事。它们可以汇总页面、从您的帐户中提取数据,甚至充当为您点击和打字的智能助手。但新的研究表明,当这些助手分不清什么是真实的、什么只是游戏时,你的凭据和敏感数据可能会受到附带损害。
每种攻击类型的特权是绕过基本规则之一:
“法学硕士设计有安全护栏,旨在防止有害行为。”
研究员 Roy Paz 设计并披露了一种他称之为“BioShocking”的攻击,这种技术通过向人工智能浏览器呈现一个虚构的现实场景,说服它们放弃安全护栏。
由此,《生化奇兵》处于即时注入和目标操纵的交叉点。即时注入之所以有效,是因为人工智能模型无法区分应用程序的指令和攻击者的指令,因此它们有时会遵循错误的指令。目标操纵攻击巧妙地改变了智能体认为应该优化的内容,将“帮助用户”转变为“不惜一切代价赢得比赛”。
在《生化奇兵》概念验证中,攻击者控制了一个看似无害的以《生化奇兵》游戏世界为主题的网页。该页面呈现了一个难题,要求人工智能代理充当自主浏览器,代表用户解决该难题。但这里有一个转折点:谜题会奖励错误的答案,并明确告诉智能体这是一个特殊的环境,通常的规则不适用。
最后一个谜题步骤指示代理访问 GitHub 存储库,找到代码中的密码或凭据等敏感数据,并在完成游戏的过程中共享它们。在针对六种主流 AI 浏览器和插件(ChatGPT Atlas、Comet、Fellou、Genspark 浏览器、Sigma 浏览器和 Claude Chrome 扩展)的测试中,每个代理都遵循说明而不是拒绝请求。
我们不仅报告威胁,还删除威胁
