详细内容或原文请订阅后点击阅览
我对 GPT-5.5 进行了 10 轮测试:得分 93/100,只为旺盛丢分
OpenAI 的最新模型提供了强大的结果,但有时会忽略简单的方向,从而在智能和控制之间造成紧张。
来源:ZDNet | 机器人新闻关注 ZDNET:将我们添加为 Google 上的首选来源。
ZDNET 的关键要点
OpenAI发布了GPT-5.5,可以简单地描述为比GPT-5.4更好、更快。新的大语言模型显示出在知识工作过程中代理编码、概念清晰度、科学研究能力和准确性方面的改进。
此版本紧随本周早些时候推出的 ChatGPT Images 2.0 之后发布,该版本将 AI 智能与图像生成结合在一起。如果您还感觉我们刚刚讨论了 GPT-5.4 的发布,那么您就没有错。
另外:我尝试了 ChatGPT Images 2.0:一个有趣的、巨大的飞跃 - 而且对实际工作非常有用
如下图所示,OpenAI 版本的发布节奏显着加快,很可能是因为 AI 编码显着缩短了 OpenAI 的开发时间。
该图表完全由 ChatGPT 5.5 Thinking 使用 Images 2.0 生成。我所做的只是告诉 AI,我想要可视化 GPT 版本之间的发布节奏,并希望它以 ZDNET 品牌风格呈现。我还提供了 ZDNET 徽标的 PNG。
整个过程,包括一些小的修正,只用了不到 10 分钟。自从计算机图形学发明以来,我一直在研究数据并手工创建像这样的专业信息图表。像这样的东西至少需要两个小时才能创建,而不是 10 分钟。
另外:我很早就了解了 ChatGPT Images 2.0,它令人印象深刻 - 但有一个例外
我已经对 Images 2.0 功能进行了一些测试。下周我会带着更多回来。在本文中,我将重点介绍 GPT-5.5 的知识能力。
让我们开始吧。
测试 1:总结新闻报道
另外:我测试了 ChatGPT Plus 与 Gemini Pro,看看哪个更好 - 以及是否值得切换
