AI的幻觉问题越来越严重

来自OpenAI和DeepSeek等科技巨头的最先进的AI模型正在以前所未有的速度生成虚假信息 - 没人知道为什么。由于AI幻觉的这种激增,跨关键领域的AI可靠性受到质疑。

来源:Qudata

AI的幻觉问题越来越严重

尽管人工智能方面取得了重大进步,但有关趋势的出现正在出现:最新,最复杂的AI模型,尤其是那些采用复杂“推理”功能的模型,正在证明不准确和捏造的信息有显着增加。这是一种通常称为“幻觉”的现象。这一发展使行业领导者感到困惑,并对AI技术的广泛应用和可靠的应用构成了巨大的挑战。

不准确和捏造信息的显着增加

最近对OpenAI和DeepSeek等主要参与者的最新模型进行了测试,这揭示了一个令人惊讶的现实:这些据称更聪明的系统以比其前任更高的速率生成错误的信息。 OpenAI自己的评估在最近的一份研究论文中详细介绍,他们的最新O3和O4-Mini模型于4月发布,与2024年底以前的O1型号相比,幻觉率显着升高。与之形成鲜明对比的是,较旧的O1模型的幻觉速度仅为16%。

最近的研究论文

该问题并非隔离到Openai。对AI模型进行排名的Vectara的独立测试表明,与同一开发人员的先前迭代相比,包括DeepSeek的R1在内的几种“推理”模型的幻觉率显着提高。这些推理模型旨在通过在得出答案之前将问题分解为多个步骤来模仿类似人类的思维过程。

通过Vectara 检索增强发电技术