GPT-5.2的新能力是否足以超越Gemini 3?尝试一下,看看

据 OpenAI 称,新模型的性能“达到或超过人类专家水平”。

来源:ZDNet | 机器人新闻

关注 ZDNET:将我们添加为 Google 上的首选来源。

ZDNET 的关键要点

  • OpenAI 于周四发布了其最新模型 GPT-5.2。
  • 它加快了模型的速度,以保持与 Google 和 Anthropic 的竞争。
  • GPT-5.2 专为专业任务和竞争对手而打造。
  • 经过一周的调侃,OpenAI 的最新模型 GPT-5.2 已经落地——它显然可以与你的专业技能相媲美。

    该公司在周四的公告中称 GPT-5.2 是“迄今为止最适合专业知识工作的模型系列”。该公司援引其最近对人工智能在工作中使用的研究指出,人工智能每天可以为普通工人节省最多一个小时; GPT-5.2 的设计似乎就是以此为基础。

    另外:OpenAI 表示,ChatGPT 每天为普通工人节省近一个小时 - 方法如下

    “我们设计 GPT-5.2 是为了为人们释放更多经济价值;它更擅长创建电子表格、构建演示文稿、编写代码、感知图像、理解长上下文、使用工具以及处理复杂的多步骤项目,”该公司写道。

    据 The Information 报道,在 Google 和 Anthropic 分别竞争性发布 Gemini 3 和 Opus 4.5 后,该公司加快了该模型的开发速度。以下是它的功能以及如何尝试。

    (披露:ZDNET 的母公司 Ziff Davis 于 2025 年 4 月对 OpenAI 提起诉讼,指控其在训练和运营其人工智能系统时侵犯了 Ziff Davis 的版权。)

    专为工作任务而打造

    OpenAI 表示,GPT-5.2“在涵盖 44 个职业的明确指定知识工作任务上优于行业专业人士。”该报告特别提到了 GDPval,这是该公司 9 月份发布的一个内部基准,试图衡量人工智能模型产生的经济价值。它通过评估模型如何处理 1,320 项任务来实现这一目标,这些任务通常与九个行业的 44 个工作岗位相关,这些行业对美国国内生产总值 (GDP) 的贡献超过 5%。

    另外:人工智能代理将使您的工作在未来几年变得面目全非的 3 种方式