OpenAI 的 o3 在推理方面击败了人类:这对您的职业生涯意味着什么

OpenAI 刚刚宣布了一种全新的模型,该模型可能刚刚跨越了 AI 能力的一个重要门槛 - 它引起了所有人的讨论。

来源:营销人工智能研究所

OpenAI 刚刚宣布了一种全新的模型,该模型可能刚刚跨越了 AI 能力的一个重要门槛——它引起了大家的讨论。

OpenAI 刚刚宣布了一种全新的模型,该模型可能刚刚跨越了 AI 能力的一个重要门槛——它引起了大家的讨论。

这个模型叫做 o3。是的,你没看错。他们完全跳过了 o2(由于一些报道的版权冲突)。除了令人困惑的命名之外,o3 是 OpenAI 高级推理模型 o1 的直接续集。

o3 o1

但与 o1 不同的是,o3 在一项众所周知的具有挑战性的智力测试中击败了人类的表现,标志着在构建更智能、更强大的 AI 的竞赛中又一次飞跃。

在《人工智能秀》第 129 集节目中,我与 Marketing AI Institute 创始人兼首席执行官 Paul Roetzer 讨论了这意味着什么。

《人工智能秀》第 129 集节目

什么是 o3?

o3 是一种人工智能模型,旨在真正做好一件事:在做出回应之前深入思考问题。这种“思维链”方法最早出现在 o1 中,但 o3 旨在进一步推理,在最难的问题上花费更多时间和计算。

而且它看起来有效。

o3 刚刚成为第一个在由著名人工智能研究员 François Chollet 创建的专门智力测试中胜过人类的模型。该测试称为 ARC-AGI。它使用简单的视觉谜题来衡量学习和适应全新环境和情况的能力——无需任何先验知识。人类在测试中的得分约为 75%。o3 得分为 76%。

ARC-AGI

这听起来可能不是一个巨大的差异,但当你了解到最先进的大型语言模型 GPT-4 在同一测试中的得分基本上接近零时,你会感到震惊。

Chollet 本人历来对人工智能炒作持怀疑态度,他称 o3 的表现是“人工智能能力令人惊讶且重要的阶跃函数提升”。

为什么这很重要

但 o3 的表现表明,人工智能在曾经被认为纯粹是人类的能力上取得了更有意义的进展。