lettuceSetect：抹布应用的幻觉检测框架 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

lettuceSetect：抹布应用的幻觉检测框架

2025年3月10日 18:37 33 Comments

如何利用Modernbert的扩展上下文窗口来构建一个令牌级别的分类器来检测幻觉的letTuceStect：针对破布应用程序的幻觉检测框架首先出现在数据科学上。

来源:走向数据科学

最初出版在Huggingface

最初在 拥抱面

我们提出了LetTuceStect，这是一种用于检索功能（RAG）管道的轻质幻觉检测器。这是一个基于编码器的模型，建立在Modernbert上，并在MIT许可下发布，并带有现成的Python软件包和预验证的型号。

LetTuceStect 基于编码器的 Modernbert

what：lettuceSetect是一个令牌级检测器，在LLM答案中标记不支持的段。 🥬如何：在Ragtruth（示例18K）中接受培训，利用Modernbert的上下文长度高达4K令牌。 🚀为什么：它解决了（1）以前仅编码模型中的上下文窗口限制，以及（2）基于LLM的检测器的高计算成本。 ⚖️

what：lettuceSetect是一个令牌级检测器，在LLM答案中标记不支持的段。 🥬

什么

如何：在Ragtruth（18K示例）上接受培训，利用Modernbert的上下文长度高达4K令牌。 🚀

如何 Ragtruth

原因：它解决了（1）以前仅编码模型中的上下文窗口限制，以及（2）基于LLM的检测器的高计算成本。 ⚖️

为什么

亮点：在Ragtruth上拍拍基于编码器的先验模型（例如Luna）。 ✅SURSURPAVES以大小的一小部分进行微调的Llama-2-13b [2]，并且在推理方面高效。 ⚡️带有MIT许可证的开源。 🔓 突出显示

在Ragtruth上击败了基于编码器的先验模型（例如Luna）。 ✅SURSURPAVES以大小的一小部分进行微调的Llama-2-13b [2]，并且在推理方面高效。 ⚡️带有MIT许可证的开源。 🔓

在Ragtruth上击败了基于编码器的先验模型（例如Luna）。 ✅

luna

在大小的一小部分中超过微调的Llama-2-13b [2]，并且在推断方面高效。 ⚡️

完全带有MIT许可证的开源。 🔓

开源

LetTuceStect通过发现LLM输出的腐烂部分来使您的抹布框架保持新鲜。 😊

新鲜腐烂

幻觉 检索 - 杰出的一代（抹布）

内在幻觉：源于模型的内部知识。

基于及时的检测器 ragas ares 0 1

开源及时的模型的验证的编码器 LetTuceStect LLM 幻觉计算成本方面令牌检测器新鲜许可证模型带有微调支持的 MIT 输出的现成的为什么 Ragtruth 上下文软件包先验