从 o1 到 o3:OpenAI 如何重新定义 AI 中的复杂推理

生成式人工智能重新定义了我们认为人工智能可以做什么。它最初只是一种用于执行简单重复任务的工具,现在正在解决我们面临的一些最具挑战性的问题。OpenAI 在这一转变中发挥了重要作用,并以其 ChatGPT 系统引领潮流。ChatGPT 的早期版本展示了人工智能如何能够 […]文章从 o1 到 o3:OpenAI 如何重新定义人工智能中的复杂推理首先出现在 Unite.AI 上。

来源:Unite.AI

生成式人工智能重新定义了我们对人工智能能力的认知。它最初只是一种用于执行简单重复性任务的工具,现在正在解决我们面临的一些最具挑战性的问题。OpenAI 在这一转变中发挥了重要作用,并以其 ChatGPT 系统引领了这一潮流。ChatGPT 的早期版本展示了人工智能如何进行类似人类的对话。这一能力让我们得以一窥生成式人工智能的可能性。随着时间的推移,该系统已经超越了简单的交互,开始应对需要推理、批判性思维和解决问题的挑战。本文探讨了 OpenAI 如何将 ChatGPT 从对话工具转变为可以推理和解决问题的系统。

o1:迈向真正推理的第一步

OpenAI 迈向推理的第一步是 2024 年 9 月发布的 o1。在 o1 之前,GPT 模型擅长理解和生成文本,但在需要结构化推理的任务上却举步维艰。o1 改变了这一现状。它旨在专注于逻辑任务,将复杂问题分解为更小、更易于管理的步骤。

o1 改变了这一点

o1 通过使用一种称为推理链的技术实现了这一目标。 这种方法通过将复杂问题(如数学、科学和编程)划分为易于解决的部分,帮助模型解决这些问题。 这种方法使 o1 比 GPT-4o 等以前的版本准确得多。 例如,在对高级数学问题进行测试时,o1 解决了 83% 的问题,而 GPT-4o 只解决了 13%。

o1 的成功不仅仅来自推理链。 OpenAI 还改进了模型的训练方式。 他们使用专注于数​​学和科学的自定义数据集并应用了大规模强化学习。 这帮助 o1 处理需要几个步骤才能解决的任务。 事实证明,在推理上花费的额外计算时间是实现以前模型无法比拟的准确性的关键因素。

强化学习。

o3:将推理提升到新水平

在 o1 成功的基础上,OpenAI 现在 推出了 o3 推出了 o3 AGI