OpenAI 现在如何保护 ChatGPT Atlas 免受攻击 - 以及为什么安全性得不到保证

“自动攻击者”模仿人类黑客的行为来测试浏览器对即时注入攻击的防御能力。但有一个问题。

来源:ZDNet | 机器人新闻

关注 ZDNET:将我们添加为 Google 上的首选来源。

ZDNET 的关键要点

  • OpenAI 构建了一个“自动攻击者”来测试 Atlas 的防御。
  • 使代理有用的品质也使它们变得脆弱。
  • 人工智能安全将长期是一场猫捉老鼠的游戏。
  • OpenAI 正在自动化测试其代理网络浏览器 ChatGPT Atlas 的过程,以查找可能危害用户的漏洞。与此同时,该公司承认,这种新型浏览器的本质可能意味着它永远无法完全免受某些类型的攻击。

    该公司周二发表了一篇博客文章,描述了其为保护 Atlas 免受即时注入攻击而做出的最新努力,在这种攻击中,恶意第三方秘密地将指令传递给浏览器背后的代理,导致其采取违背用户利益的行为;把它想象成一种暂时控制宿主的数字病毒。

    另外:使用AI浏览器?保护自己免受即时注射的 5 种方法 - 以免为时已晚

    新方法利用人工智能来模仿人类黑客的行为。通过自动化红队流程,研究人员可以更快、更彻底地探索安全领域——考虑到代理网络浏览器交付给消费者的速度,这一点显得尤为重要。

    然而,重要的是,该博客文章强调,即使采用最复杂的安全方法,像 Atlas 这样的代理 Web 浏览器本质上也很容易受到攻击,并且很可能仍然如此。 OpenAI 表示,业界所能期望的最好结果就是努力领先攻击者一步。

    “我们希望对手能够不断适应,”该公司在博客文章中写道。 “即时注入,就像网络上的诈骗和社会工程一样,不太可能完全‘解决’。但我们乐观地认为,主动、高度响应的快速响应循环可以随着时间的推移继续大幅降低现实世界的风险。”

    “基于 LLM 的自动攻击者”

    但代理权越大,风险就越大。