gpt-5是,嗯,不是我们所期望的。 AI刚刚平稳吗?

AI淘金热可能已经结束。

来源:ZME科学
图像通过Unsplash。

OpenAi声称其新的旗舰模型GPT-5标志着“沿着AGI的道路迈出的重要一步”,即AI Bosses和自称专家经常声称的人工通用情报。

OpenAi声称

根据Openai自己的定义,AGI将是“在大多数经济上有价值的工作中表现优于人类的高度自主体系”。搁置这是否是人类应该为之努力的事情,Openai首席执行官Sam Altman关于GPT-5的论点是朝这个方向上的“重要一步”,听起来令人难以置信。

Sam Altman的论点 gpt-5为

他声称GPT-5在编写计算机代码方面比其前任更好。据说它的“幻觉”要少一些,并且在以下说明上要好一些 - 尤其是当他们需要遵循多个步骤并使用其他软件时。该模型显然也更加安全,更不``Sycophantic'',因为它不会欺骗用户或提供潜在的有害信息来取悦他们。

Altman确实说:“ GPT-5是第一次真正感觉就像与任何主题的专家(例如博士学位专家)交谈”。然而,它仍然没有关于它说明是否准确的线索,正如您从下面尝试绘制北美地图的尝试中可以看到的那样。

Altman确实说

它也无法从自己的经验中学习,也无法在“人类的最后考试”等具有挑战性的基准上获得超过42%的准确性,该基准包含有关各种科学(和其他)主题的棘手问题。据说这是埃隆·马斯克(Elon Musk)最近发布的模型略低于Grok 4的44%。

据说已经实现了

GPT-5背后的主要技术创新似乎是引入“路由器”。这决定了当被问到问题时要委派的GPT模型,从本质上讲,要投资于计算其答案的努力(然后通过从反馈中学习其以前的选择来改善其答案)。