AI 安全机构报告称，Anthropic 的神话发展速度比预期更快 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

AI 安全机构报告称，Anthropic 的神话发展速度比预期更快

2026年5月14日 17:32 33 Comments

首次发布仅一个月后，Anthropic 传奇的 Mythos 模型就突破了新的测试界限。

来源:ZDNet | 机器人新闻

关注 ZDNET：将我们添加为 Google 上的首选来源。

ZDNET 的关键要点

克劳德神话最新版本已经进阶。

外部研究人员发现它在测试中取得了多项第一。

人工智能能力的提升速度可能比预期快得多。

Anthropic 的 Claude Mythos 该公司认为其功能过于强大而无法普遍发布，但它似乎已经获得了新的功能。

在周三发布的一篇博客文章中，英国人工智能安全研究所 (AISI) 报告称，它已经测试了 Mythos 的新版本，该版本的性能优于其早期结果和 OpenAI 的 GPT-5.5——距离 Mythos 首次发布仅一个月。

另外：Apple、Google 和 Microsoft 加入 Anthropic 的 Glasswing 项目，保卫世界上最关键的软件

“较新的神话预览检查点完成了我们的两个网络靶场，在 10 次尝试中的 6 次中解决了‘最后的人’靶场，在 10 次尝试中的 3 次中解决了之前未解决的‘冷却塔’，”博客作者写道。 “这是模型第一次完成我们两个网络靶场中的第二个。”

上个月，当 Anthropic 首次宣布 Mythos Preview 和 Project Glasswing（它与竞争对手的科技公司和 AI 实验室组成的网络安全测试联盟，并给予其对 Mythos 的有限访问权限）时，英国 AISI 对其进行了评估，发现该模型“在网络性能已经迅速改善的环境中，代表了比之前的前沿模型的进步”。

第三方的观点有助于平衡有关 Mythos 的炒作要么纯粹是营销，要么在另一端标志着人工智能能力发生灾难性转变的说法。关于模型能做什么的真相可能是介于两者之间。

另外：如何通过 Anthropic 的 AI 课程免费学习 Claude Code - 我只花了 20 分钟

AISI 的更新测试还证明，功能改进并不局限于单个模型版本，而是可以发生在单个模型的版本内。

快速增长的网络威胁

AISI 版本靶场人工智能模型增长的公司 ZDNET 未解决的环境 Anthropic 关键的网络性能第三方 Mythos 首次发布网络安全实验室博客神话测试组成的最后的 Google 发布的功能研究人员检查点模型的能力发生研究所