AI 对决:GPT‑5.3-Codex 与 Claude Opus 4.6

OpenAI 和 Anthropic 正在重新定义人工智能的功能,推出能够处理从编码到多步骤知识工作等复杂任务的模型。凭借代理协作、长上下文推理和自主解决问题等功能,这些升级展示了人工智能作为跨专业工作流程的智能数字协作者的潜力。

来源:Qudata

AI 对决:GPT‑5.3-Codex 与 Claude Opus 4.6

随着 OpenAI 和 Anthropic 发布其旗舰模型的重大更新,人工智能竞赛正在加速,不仅针对编码,还针对全方位的知识工作。

OpenAI 的 GPT-5.3-Codex 将自己定位为不仅仅是一个编码助手。该模型在保持 SWE‑Bench Pro 和 Terminal‑Bench 2.0 等基准测试上最先进的性能的同时,旨在处理整个软件生命周期中复杂、长时间运行的任务,包括调试、部署、监控、编写 PRD、编辑副本和进行用户研究。据 OpenAI 称,GPT-5.3-Codex 现在可以自主构建游戏和网络应用程序,迭代数百万个代币,同时提供频繁更新以使人类协作者随时了解情况。

一个关键的区别在于模型的代理能力:用户可以在任务中与 Codex 交互、提出问题、提供反馈并实时引导其方法。该模型还在内部被利用,以加速其自身的训练、调试、部署和测试流程,OpenAI 将其描述为“创建自身的工具”。尽管头条新闻暗示该模型是“自己构建的”,但 OpenAI 澄清说,这一说法指的是该模型对其自身开发的支持,而不是完全自主的创建。

安全仍然是首要任务。 GPT-5.3-Codex 是第一个被归类为网络安全任务高能力的模型,经过培训可识别软件漏洞。 OpenAI 正在实施保障措施,包括将高风险请求路由至 GPT-5.2、网络可信访问计划以及支持道德安全研究的资助计划。

性能改进是显而易见的:GPT‑5.3-Codex 的运行速度比其前身快 25%,基础设施优化可确保高需求期间的稳定延迟。该模型目前可在 Codex 应用程序、CLI、IDE 扩展和 Web 界面中使用,并计划在不久的将来进行 API 访问。