我对 GPT-5.5 进行了 10 轮测试：得分 93/100，只为旺盛丢分 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

我对 GPT-5.5 进行了 10 轮测试：得分 93/100，只为旺盛丢分

2026年4月24日 12:21 33 Comments

OpenAI 的最新模型提供了强大的结果，但有时会忽略简单的方向，从而在智能和控制之间造成紧张。

来源:ZDNet | 机器人新闻

关注 ZDNET：将我们添加为 Google 上的首选来源。

GPT-5.5 提供跨任务的精美、有用的答案。

在写作、编码和推理任务中表现出色。

过于急切会损害准确性和遵循指令。

OpenAI发布了GPT-5.5，可以简单地描述为比GPT-5.4更好、更快。新的大语言模型显示出在知识工作过程中代理编码、概念清晰度、科学研究能力和准确性方面的改进。

此版本紧随本周早些时候推出的 ChatGPT Images 2.0 之后发布，该版本将 AI 智能与图像生成结合在一起。如果您还感觉我们刚刚讨论了 GPT-5.4 的发布，那么您就没有错。

另外：我尝试了 ChatGPT Images 2.0：一个有趣的、巨大的飞跃 - 而且对实际工作非常有用

如下图所示，OpenAI 版本的发布节奏显着加快，很可能是因为 AI 编码显着缩短了 OpenAI 的开发时间。

该图表完全由 ChatGPT 5.5 Thinking 使用 Images 2.0 生成。我所做的只是告诉 AI，我想要可视化 GPT 版本之间的发布节奏，并希望它以 ZDNET 品牌风格呈现。我还提供了 ZDNET 徽标的 PNG。

整个过程，包括一些小的修正，只用了不到 10 分钟。自从计算机图形学发明以来，我一直在研究数据并手工创建像这样的专业信息图表。像这样的东西至少需要两个小时才能创建，而不是 10 分钟。

另外：我很早就了解了 ChatGPT Images 2.0，它令人印象深刻 - 但有一个例外

我已经对 Images 2.0 功能进行了一些测试。下周我会带着更多回来。在本文中，我将重点介绍 GPT-5.5 的知识能力。

让我们开始吧。

可用积分：10

获得积分：5

另外：我测试了 ChatGPT Plus 与 Gemini Pro，看看哪个更好 - 以及是否值得切换

修正测试 ChatGPT 计算机巨大的 OpenAI 版本可视化创建工作过程清晰度 10 Images ZDNET 准确性能力编码有用的 2.0 节奏 AI 图表发布图像生成 GPT 5.5 科学研究