OpenAI 的 o3 在推理方面击败了人类：这对您的职业生涯意味着什么 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

OpenAI 的 o3 在推理方面击败了人类：这对您的职业生涯意味着什么

2025年1月7日 15:38 33 Comments

OpenAI 刚刚宣布了一种全新的模型，该模型可能刚刚跨越了 AI 能力的一个重要门槛 - 它引起了所有人的讨论。

来源:营销人工智能研究所

OpenAI 刚刚宣布了一种全新的模型，该模型可能刚刚跨越了 AI 能力的一个重要门槛——它引起了大家的讨论。

这个模型叫做 o3。是的，你没看错。他们完全跳过了 o2（由于一些报道的版权冲突）。除了令人困惑的命名之外，o3 是 OpenAI 高级推理模型 o1 的直接续集。

o3 o1

但与 o1 不同的是，o3 在一项众所周知的具有挑战性的智力测试中击败了人类的表现，标志着在构建更智能、更强大的 AI 的竞赛中又一次飞跃。

在《人工智能秀》第 129 集节目中，我与 Marketing AI Institute 创始人兼首席执行官 Paul Roetzer 讨论了这意味着什么。

《人工智能秀》第 129 集节目

o3 是一种人工智能模型，旨在真正做好一件事：在做出回应之前深入思考问题。这种“思维链”方法最早出现在 o1 中，但 o3 旨在进一步推理，在最难的问题上花费更多时间和计算。

而且它看起来有效。

o3 刚刚成为第一个在由著名人工智能研究员 François Chollet 创建的专门智力测试中胜过人类的模型。该测试称为 ARC-AGI。它使用简单的视觉谜题来衡量学习和适应全新环境和情况的能力——无需任何先验知识。人类在测试中的得分约为 75%。o3 得分为 76%。

ARC-AGI

这听起来可能不是一个巨大的差异，但当你了解到最先进的大型语言模型 GPT-4 在同一测试中的得分基本上接近零时，你会感到震惊。

Chollet 本人历来对人工智能炒作持怀疑态度，他称 o3 的表现是“人工智能能力令人惊讶且重要的阶跃函数提升”。

但 o3 的表现表明，人工智能在曾经被认为纯粹是人类的能力上取得了更有意义的进展。

阶跃函数智力表现测试基本上 OpenAI 人工智能创始人模型思考问题意味着刚刚执行官 o3 能力可能研究员 AI o1 人类全新的讨论