GPT-5.2的新能力是否足以超越Gemini 3？尝试一下，看看 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

GPT-5.2的新能力是否足以超越Gemini 3？尝试一下，看看

2025年12月11日 21:15 33 Comments

据 OpenAI 称，新模型的性能“达到或超过人类专家水平”。

来源:ZDNet | 机器人新闻

关注 ZDNET：将我们添加为 Google 上的首选来源。

ZDNET 的关键要点

OpenAI 于周四发布了其最新模型 GPT-5.2。

它加快了模型的速度，以保持与 Google 和 Anthropic 的竞争。

GPT-5.2 专为专业任务和竞争对手而打造。

经过一周的调侃，OpenAI 的最新模型 GPT-5.2 已经落地——它显然可以与你的专业技能相媲美。

该公司在周四的公告中称 GPT-5.2 是“迄今为止最适合专业知识工作的模型系列”。该公司援引其最近对人工智能在工作中使用的研究指出，人工智能每天可以为普通工人节省最多一个小时； GPT-5.2 的设计似乎就是以此为基础。

另外：OpenAI 表示，ChatGPT 每天为普通工人节省近一个小时 - 方法如下

“我们设计 GPT-5.2 是为了为人们释放更多经济价值；它更擅长创建电子表格、构建演示文稿、编写代码、感知图像、理解长上下文、使用工具以及处理复杂的多步骤项目，”该公司写道。

据 The Information 报道，在 Google 和 Anthropic 分别竞争性发布 Gemini 3 和 Opus 4.5 后，该公司加快了该模型的开发速度。以下是它的功能以及如何尝试。

（披露：ZDNET 的母公司 Ziff Davis 于 2025 年 4 月对 OpenAI 提起诉讼，指控其在训练和运营其人工智能系统时侵犯了 Ziff Davis 的版权。）

专为工作任务而打造

OpenAI 表示，GPT-5.2“在涵盖 44 个职业的明确指定知识工作任务上优于行业专业人士。”该报告特别提到了 GDPval，这是该公司 9 月份发布的一个内部基准，试图衡量人工智能模型产生的经济价值。它通过评估模型如何处理 1,320 项任务来实现这一目标，这些任务通常与九个行业的 44 个工作岗位相关，这些行业对美国国内生产总值 (GDP) 的贡献超过 5%。

另外：人工智能代理将使您的工作在未来几年变得面目全非的 3 种方式

工作任务产生电子表格工作中评估模型任务复杂的处理 Ziff 美国 OpenAI 人工智能行业尝试模型使用的 Google 5.2 母公司公司发布的价值模型的 ZDNET Anthropic GPT 工作的经济