lettuceSetect:抹布应用的幻觉检测框架

如何利用Modernbert的扩展上下文窗口来构建一个令牌级别的分类器来检测幻觉的letTuceStect:针对破布应用程序的幻觉检测框架首先出现在数据科学上。

来源:走向数据科学

最初出版在Huggingface

最初在 拥抱面

tl; dr

我们提出了LetTuceStect,这是一种用于检索功能(RAG)管道的轻质幻觉检测器。这是一个基于编码器的模型,建立在Modernbert上,并在MIT许可下发布,并带有现成的Python软件包和预验证的型号。

LetTuceStect 基于编码器的 Modernbert
    what:lettuceSetect是一个令牌级检测器,在LLM答案中标记不支持的段。 🥬如何:在Ragtruth(示例18K)中接受培训,利用Modernbert的上下文长度高达4K令牌。 🚀为什么:它解决了(1)以前仅编码模型中的上下文窗口限制,以及(2)基于LLM的检测器的高计算成本。 ⚖️
  • what:lettuceSetect是一个令牌级检测器,在LLM答案中标记不支持的段。 🥬
  • 什么
  • 如何:在Ragtruth(18K示例)上接受培训,利用Modernbert的上下文长度高达4K令牌。 🚀
  • 如何 Ragtruth
  • 原因:它解决了(1)以前仅编码模型中的上下文窗口限制,以及(2)基于LLM的检测器的高计算成本。 ⚖️
  • 为什么
      亮点:在Ragtruth上拍拍基于编码器的先验模型(例如Luna)。 ✅SURSURPAVES以大小的一小部分进行微调的Llama-2-13b [2],并且在推理方面高效。 ⚡️带有MIT许可证的开源。 🔓
    突出显示
      在Ragtruth上击败了基于编码器的先验模型(例如Luna)。 ✅SURSURPAVES以大小的一小部分进行微调的Llama-2-13b [2],并且在推理方面高效。 ⚡️带有MIT许可证的开源。 🔓
  • 在Ragtruth上击败了基于编码器的先验模型(例如Luna)。 ✅
  • luna
  • 在大小的一小部分中超过微调的Llama-2-13b [2],并且在推断方面高效。 ⚡️
  • 完全带有MIT许可证的开源。 🔓
  • 开源

    LetTuceStect通过发现LLM输出的腐烂部分来使您的抹布框架保持新鲜。 😊

    新鲜 腐烂

    快速链接

    为什么要lettuceStect?

    幻觉 检索 - 杰出的一代(抹布)
  • 内在幻觉:源于模型的内部知识。
  • 基于及时的检测器 ragas ares 0 1