Meta 黑客攻击表明人工智能安全不仅仅是神话

6 月 5 日,404 Media 报道称,攻击者一直在使用 Meta 的 AI 客户支持代理窃取 Instagram 帐户。他们的方法很简单:他们要求代理将帐户链接到他们控制的电子邮件地址,代理同意了。一名攻击者闯入了休眠的奥巴马白宫帐户并支持伊朗......

来源:MIT Technology Review _人工智能

一段时间以来,龚和其他学者一直在对人工智能代理的安全漏洞发出警告。他们发表论文和博客文章,详细介绍了间接提示注入等漏洞,其中涉及使用隐藏在网站、电子邮件或其他看似平淡的数据源中的命令来劫持代理。与这些技术相比,Meta hack 几乎是无意识的。黑客必须克服的唯一难题是使用与真实帐户所有者位置相匹配的 VPN;然后他们直接要求支持人员更改帐户的电子邮件地址,支持人员同意了。

Meta 尚未公开评论此漏洞是如何被泄露的。但龚说,考虑到该漏洞的简单性,在部署代理之前,它应该很容易被发现。 “这真的很令人惊讶,”他说。 “我不明白为什么他们没有发现这个简单的问题。”

乔治城安全与新兴技术中心的高级研究分析师 Jessica Ji 对此表示同意。 “这引发了这样的问题:是否有护栏?”她说。 “有人想过测试一下这种场景吗?”她指出,来自像 Meta 这样在人工智能和网络安全方面拥有丰富专业知识的公司的监督尤其引人注目。 Meta 没有回应对本文发表评论的请求,但周一 Meta 发言人在 X 上表示该漏洞已得到解决。

有多种方法可以减轻风险。公司可以使用传统软件构建护栏,确保代理遵循严格的规则,例如在将敏感帐户信息发送到新电子邮件地址之前始终询问安全问题的答案。本文咨询的专家都同意代理应该经历严格的红队,在这个过程中,开发人员尽最大努力攻击系统,以便在部署之前发现其漏洞。