OpenAI 十周年、新模式和超级智能竞赛

OpenAI 刚刚迎来了 10 周年大新闻:GPT-5.2 的发布,这是一个旨在掌握知识工作的模型,并且首席执行官 Sam Altman 大胆预测,超级智能在未来十年几乎是不可避免的。

来源:营销人工智能研究所

OpenAI 刚刚迎来了 10 周年大新闻:GPT-5.2 的发布,这是一个旨在掌握知识工作的模型,首席执行官 Sam Altman 大胆预测,超级智能在未来十年几乎是不可避免的。

新模型遵循内部“红色代码”指令来加速开发,引入了重大改进,使其比以前的模型能够从头到尾更好地执行复杂的现实任务。

此版本标志着 OpenAi 正在从抽象的 IQ 分数转向跟踪 AI 在实际工作中执行情况的指标。

为了讨论 GPT-5.2 的潜在影响和 OpenAI 在商业领域第一个有影响力的十年,我在《人工智能秀》第 186 集中与 SmarterX 和 Marketing AI Institute 创始人兼首席执行官 Paul Roetzer 进行了详细讨论。

超越智商的智力

早期,人工智能行业使用看起来很像标准化测试的基准来衡量进展,本质上是机器的智商测试。但根据 Roetzer 的说法,我们已经达到了这些指标的上限。

“智商测试基本上已经饱和,”Roetzer 说。 “当你尝试根据人类可能进行的标准化测试来评估这些模型时,人工智能已经存在。

在许多此类任务中,即使没有超出人类的最高水平,也基本上处于人类的最高水平。因此,当我们谈论智商点的提高时,我们所有人都很难感受到其中的差异。”

GPT-5.2 来了,为 GDP 增加价值

随着 GPT-5.2 的发布,OpenAI 正在大力采用新的基准,该基准评估模型执行 44 个职业的 1,300 项特定任务的能力,这些任务对国内生产总值有贡献。结果是现实世界的可交付成果,例如创建法律摘要、工程蓝图和护理计划。

结果令人大开眼界:OpenAI 报告称,在直接比较中,GPT-5.2 Thinking 与人类专家的胜率约为 71%。

比人类更快、更便宜、“更好”?

使命的改变