克劳德寓言5秘密扼杀人工智能研究人员,互联网陷入疯狂

《克劳德寓言 5》让用户能够获得神话级的力量,但其隐藏的保障措施将安全功能变成了 Anthropic 的信任问题。

来源:ZDNet | 机器人新闻

关注 ZDNET:将我们添加为 Google 上的首选来源。

ZDNET 的关键要点

  • 《神鬼寓言 5》的强烈反对是因为透明度,而不是原始的人工智能能力。
  • 隐藏的保障措施让研究人员质疑他们正在测试的内容。
  • 网络安全专家警告说,护栏也会阻挡防御者。
  • Mythos 于 4 月份作为 Glasswing 项目的一部分推出,该项目是顶级技术组织和 Anthropic 之间的合作伙伴关系,旨在查找和修复互联网基础设施中的漏洞。它仅限于某些组织,因为可以找到以前未知的漏洞来修复它们的工具也可以用于查找以前未知的漏洞来利用它们。

    另外:Apple、Google 和 Microsoft 加入 Anthropic 的 Glasswing 项目,保卫世界上最关键的软件

    Mythos 和 Glasswing 比 Anthropic 的 Claude Security 工具强大得多,后者设计为在 Opus 中运行。尽管如此,Claude Security 仍可以扫描代码库并帮助发现一些问题。但随后,本周早些时候,Anthropic 宣布并发布了《神鬼寓言》,严格来说是“神鬼寓言 5”,它实际上是《神话》的封闭版本。

    Anthropic 明确表示《神鬼寓言》不会支持网络安全、生物学和化学领域某些有风险的研究途径。

    另外:Anthropic 的新 Claude Security 工具会扫描您的代码库是否存在缺陷 - 并帮助您决定首先修复哪些内容

    然而,一些人警告不要过分相信安全声明。

    “应谨慎对待防越狱声明,”Exabeam(一家安全分析公司)的高级威胁研究工程师 Sally Vincent 通过电子邮件表示。结果“代表了时间点评估。攻击者不断适应,”她补充道。

    尽管如此,Anthropic 并不希望人们在自家后院制造生物武器。这个限制是明确的。当提出此类请求时,克劳德会将情报从寓言级别降级为作品级别,并且最重要的是,告诉用户降级正在发生。

    到目前为止,一切顺利。

    但后来一切都变了

    Anthropic 的回应

    数据保留问题