gpt-5是，嗯，不是我们所期望的。 AI刚刚平稳吗？ XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

gpt-5是，嗯，不是我们所期望的。 AI刚刚平稳吗？

2025年8月15日 08:36 33 Comments

AI淘金热可能已经结束。

来源:ZME科学

图像通过Unsplash。

OpenAi声称其新的旗舰模型GPT-5标志着“沿着AGI的道路迈出的重要一步”，即AI Bosses和自称专家经常声称的人工通用情报。

OpenAi声称

根据Openai自己的定义，AGI将是“在大多数经济上有价值的工作中表现优于人类的高度自主体系”。搁置这是否是人类应该为之努力的事情，Openai首席执行官Sam Altman关于GPT-5的论点是朝这个方向上的“重要一步”，听起来令人难以置信。

Sam Altman的论点 gpt-5为

他声称GPT-5在编写计算机代码方面比其前任更好。据说它的“幻觉”要少一些，并且在以下说明上要好一些 - 尤其是当他们需要遵循多个步骤并使用其他软件时。该模型显然也更加安全，更不``Sycophantic''，因为它不会欺骗用户或提供潜在的有害信息来取悦他们。

Altman确实说：“ GPT-5是第一次真正感觉就像与任何主题的专家（例如博士学位专家）交谈”。然而，它仍然没有关于它说明是否准确的线索，正如您从下面尝试绘制北美地图的尝试中可以看到的那样。

Altman确实说

它也无法从自己的经验中学习，也无法在“人类的最后考试”等具有挑战性的基准上获得超过42％的准确性，该基准包含有关各种科学（和其他）主题的棘手问题。据说这是埃隆·马斯克（Elon Musk）最近发布的模型略低于Grok 4的44％。

据说已经实现了

GPT-5背后的主要技术创新似乎是引入“路由器”。这决定了当被问到问题时要委派的GPT模型，从本质上讲，要投资于计算其答案的努力（然后通过从反馈中学习其以前的选择来改善其答案）。

工作中计算机背后的答案提供以前的模型路由器 Altman Openai 向上的问题执行官专家声称人类 OpenAi 主题的有价值准确的 Sam 自己的尝试潜在的发布的 AGI 准确性基准根据 GPT 技术创新据说