OpenAI 售价 200 美元的 ChatGPT Pro:思考更深入的 AI(但你需要它吗?)

OpenAI 刚刚推出了他们所谓的“世界上最智能的模型”。它的月费为 200 美元,并承诺比我们以前见过的任何东西都更努力地思考、更长时间地工作和解决更复杂的问题。但在这个似乎每周都会发布人工智能公告的世界里,这个公告值得[…] 文章 OpenAI 的 200 美元 ChatGPT Pro:思考更深入的人工智能(但你需要它吗?)首先出现在 Unite.AI 上。

来源:Unite.AI

OpenAI 刚刚推出了他们所谓的“世界上最智能的模型”。它的月费为 200 美元,并承诺比我们以前见过的任何东西都更努力地思考、更长时间地工作并解决更复杂的问题。但在这个似乎每周都会发布 AI 公告的世界里,这个值得仔细研究。

由 o1 模型提供支持的全新 ChatGPT Pro 不仅仅是另一次常规升级。虽然常规 ChatGPT 已成为 AI 工具中的瑞士军刀,但这款新产品更像是专业的手术设备——功能强大,但并不适合所有人。

ChatGPT Pro o1 模型

o1 真正带来了什么

让我们拨开炒作的面纱,看看是什么让 o1 与众不同。该模型显示了一些令人印象深刻的数字,但重要的是这些改进实际上在哪些方面发挥了作用。

在实际测试中,o1 在三个关键领域有所改进:

    深度技术问题解决:该模型在 AIME 2024 数学竞赛问题上的准确率达到 50%——高于之前版本的 37%。但更重要的是,它始终保持这种性能。在可靠性测试中(4 次中有 4 次得到正确答案),o1 pro 模式的表现明显优于其前代产品。科学推理:在博士级科学问题中,o1 的成功率为 74%,一致性的提高更为令人印象深刻。有趣的是,这如何转化为实际的研究应用——我们看到研究人员使用它来设计复杂的生物实验。编程和技术分析:也许最能说明问题的是,o1 在高级编程挑战中的通过率为 62%,在复杂、多步骤的问题解决方面表现出特别的优势。然而——这一点至关重要——它实际上在处理需要来回对话的更简单、迭代的任务时遇到了困难。
深度技术问题解决: 深度技术问题解决: 科学推理: 科学推理: 编程和技术分析:

图片:OpenAI

可靠性: