AI 安全机构报告称,Anthropic 的神话发展速度比预期更快

首次发布仅一个月后,Anthropic 传奇的 Mythos 模型就突破了新的测试界限。

来源:ZDNet | 机器人新闻

关注 ZDNET:将我们添加为 Google 上的首选来源。

ZDNET 的关键要点

  • 克劳德神话最新版本已经进阶。
  • 外部研究人员发现它在测试中取得了多项第一。
  • 人工智能能力的提升速度可能比预期快得多。
  • Anthropic 的 Claude Mythos 该公司认为其功能过于强大而无法普遍发布,但它似乎已经获得了新的功能。

    在周三发布的一篇博客文章中,英国人工智能安全研究所 (AISI) 报告称,它已经测试了 Mythos 的新版本,该版本的性能优于其早期结果和 OpenAI 的 GPT-5.5——距离 Mythos 首次发布仅一个月。

    另外:Apple、Google 和 Microsoft 加入 Anthropic 的 Glasswing 项目,保卫世界上最关键的软件

    “较新的神话预览检查点完成了我们的两个网络靶场,在 10 次尝试中的 6 次中解决了‘最后的人’靶场,在 10 次尝试中的 3 次中解决了之前未解决的‘冷却塔’,”博客作者写道。 “这是模型第一次完成我们两个网络靶场中的第二个。”

    上个月,当 Anthropic 首次宣布 Mythos Preview 和 Project Glasswing(它与竞争对手的科技公司和 AI 实验室组成的网络安全测试联盟,并给予其对 Mythos 的有限访问权限)时,英国 AISI 对其进行了评估,发现该模型“在网络性能已经迅速改善的环境中,代表了比之前的前沿模型的进步”。

    第三方的观点有助于平衡有关 Mythos 的炒作要么纯粹是营销,要么在另一端标志着人工智能能力发生灾难性转变的说法。关于模型能做什么的真相可能是介于两者之间。

    另外:如何通过 Anthropic 的 AI 课程免费学习 Claude Code - 我只花了 20 分钟

    AISI 的更新测试还证明,功能改进并不局限于单个模型版本,而是可以发生在单个模型的版本内。

    快速增长的网络威胁