OpenAi的新AI模型比以前更具幻觉

OpenAI的最新AI型号,尤其是O3和O4-Mini,比其前辈更具幻觉。 “幻觉”是指AI建模创造性信息或提供错误的答案。这种现象使用户和研究人员造成了混乱,因为通常预计较新的模型比较旧的模型更可靠。研究人员发现的是,Clissuce Research Group最近对[…] Openai的新AI模型进行了深入的调查,比以前最初出现在AI新闻中的幻觉更具幻觉。

来源:AI新闻
OpenAI的最新AI型号,尤其是O3和O4-Mini,比其前辈更具幻觉。 “幻觉”是指AI建模创造性信息或提供错误的答案。这种现象使用户和研究人员造成了混乱,因为通常预计更新的模型比较旧的模型更可靠。公共LLM排名列表由Vectaras Hughes幻觉评估模型研究人员计算出的Discovery Group最近进行了OpenAI的深入调查:最引人注目的例子之一是,O3通常声称在无法访问此类时使用代码工具。当用户面对这些工厂的模型时,它会加倍,甚至试图证明其错误的答案合理性,而不是认识到错误。足够的融合:“在对OpenAI的O3模型进行预先测试期间,我们发现O3经常制定其声称所采取的措施来满足用户的使用。限于O3,但也适用于其他推理模型,例如O3-Mini和O1。从Aim ultife中,比较了13个不同的LLM模型,并且根据他们的研究而令人担忧。