检测基于抹布的系统的幻觉

这篇文章将为您介绍如何为基于抹布的应用创建基本的幻觉检测系统。我们还根据准确性,精确度,召回和成本来权衡不同方法的利弊。

来源:亚马逊云科技 _机器学习
随着AI系统中生成的AI和知识提取的兴起,检索增强发电(RAG)已成为增强AI生成响应的准确性和可靠性的重要工具。抹布是一种合并大型语言模型(LLM)未经训练的其他数据的方式。这还可以帮助减少虚假或误导性信息的产生(幻觉)。但是,即使有抹布的能力,AI幻觉的挑战仍然是一个重大问题。AI系统越来越多地整合到我们的日常生活和关键的决策过程中,检测和减轻幻觉的能力至关重要。大多数幻觉检测技术都集中在提示和响应上。但是,如果有其他上下文可用,例如在基于抹布的应用程序中,可以引入新技术以更好地减轻幻觉问题。此后,您可以通过如何为基于抹布的应用程序创建基本的幻觉检测系统。 We also weigh the pros and cons of different methods in terms of accuracy, precision, recall, and cost.Although there are currently many new state-of-the-art techniques, the approaches outlined in this post aim to provide simple, user-friendly techniques that you can quickly incorporate into your RAG pipeline to increase the quality of the outputs in your RAG system.Solution overviewHallucinations can be categorized into three types, as illustrated in the following Graphic.Scientific文献提出了多种幻觉检测技术。在以下各节中,我们讨论并实施了四种检测幻觉的突出方法:使用基于LLM的探测器,语义相似性检测器,BERT随机检查器和令牌相似性检测器。最后,我们比较了方法的性能和延迟。