详细内容或原文请订阅后点击阅览
GPT-5.2的新能力是否足以超越Gemini 3?尝试一下,看看
据 OpenAI 称,新模型的性能“达到或超过人类专家水平”。
来源:ZDNet | 机器人新闻关注 ZDNET:将我们添加为 Google 上的首选来源。
ZDNET 的关键要点
经过一周的调侃,OpenAI 的最新模型 GPT-5.2 已经落地——它显然可以与你的专业技能相媲美。
该公司在周四的公告中称 GPT-5.2 是“迄今为止最适合专业知识工作的模型系列”。该公司援引其最近对人工智能在工作中使用的研究指出,人工智能每天可以为普通工人节省最多一个小时; GPT-5.2 的设计似乎就是以此为基础。
另外:OpenAI 表示,ChatGPT 每天为普通工人节省近一个小时 - 方法如下
“我们设计 GPT-5.2 是为了为人们释放更多经济价值;它更擅长创建电子表格、构建演示文稿、编写代码、感知图像、理解长上下文、使用工具以及处理复杂的多步骤项目,”该公司写道。
据 The Information 报道,在 Google 和 Anthropic 分别竞争性发布 Gemini 3 和 Opus 4.5 后,该公司加快了该模型的开发速度。以下是它的功能以及如何尝试。
(披露:ZDNET 的母公司 Ziff Davis 于 2025 年 4 月对 OpenAI 提起诉讼,指控其在训练和运营其人工智能系统时侵犯了 Ziff Davis 的版权。)
专为工作任务而打造
OpenAI 表示,GPT-5.2“在涵盖 44 个职业的明确指定知识工作任务上优于行业专业人士。”该报告特别提到了 GDPval,这是该公司 9 月份发布的一个内部基准,试图衡量人工智能模型产生的经济价值。它通过评估模型如何处理 1,320 项任务来实现这一目标,这些任务通常与九个行业的 44 个工作岗位相关,这些行业对美国国内生产总值 (GDP) 的贡献超过 5%。
另外:人工智能代理将使您的工作在未来几年变得面目全非的 3 种方式
