OpenAI 十周年、新模式和超级智能竞赛 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

OpenAI 十周年、新模式和超级智能竞赛

2025年12月16日 14:03 33 Comments

OpenAI 刚刚迎来了 10 周年大新闻：GPT-5.2 的发布，这是一个旨在掌握知识工作的模型，并且首席执行官 Sam Altman 大胆预测，超级智能在未来十年几乎是不可避免的。

来源:营销人工智能研究所

OpenAI 刚刚迎来了 10 周年大新闻：GPT-5.2 的发布，这是一个旨在掌握知识工作的模型，首席执行官 Sam Altman 大胆预测，超级智能在未来十年几乎是不可避免的。

新模型遵循内部“红色代码”指令来加速开发，引入了重大改进，使其比以前的模型能够从头到尾更好地执行复杂的现实任务。

此版本标志着 OpenAi 正在从抽象的 IQ 分数转向跟踪 AI 在实际工作中执行情况的指标。

为了讨论 GPT-5.2 的潜在影响和 OpenAI 在商业领域第一个有影响力的十年，我在《人工智能秀》第 186 集中与 SmarterX 和 Marketing AI Institute 创始人兼首席执行官 Paul Roetzer 进行了详细讨论。

早期，人工智能行业使用看起来很像标准化测试的基准来衡量进展，本质上是机器的智商测试。但根据 Roetzer 的说法，我们已经达到了这些指标的上限。

“智商测试基本上已经饱和，”Roetzer 说。 “当你尝试根据人类可能进行的标准化测试来评估这些模型时，人工智能已经存在。

在许多此类任务中，即使没有超出人类的最高水平，也基本上处于人类的最高水平。因此，当我们谈论智商点的提高时，我们所有人都很难感受到其中的差异。”

随着 GPT-5.2 的发布，OpenAI 正在大力采用新的基准，该基准评估模型执行 44 个职业的 1,300 项特定任务的能力，这些任务对国内生产总值有贡献。结果是现实世界的可交付成果，例如创建法律摘要、工程蓝图和护理计划。

结果令人大开眼界：OpenAI 报告称，在直接比较中，GPT-5.2 Thinking 与人类专家的胜率约为 71%。

以前的执行官人类 Roetzer 执行测试提高人工智能任务根据工作中 OpenAI 复杂的 5.2 工作的世界的评估模型测试的现实 GPT 基本上智商模型标准化 AI 基准创始人