详细内容或原文请订阅后点击阅览
块大小作为 RAG 系统中的实验变量
通过试验不同的块大小来理解 RAG 系统中的检索《块大小作为 RAG 系统中的实验变量》一文首先出现在《走向数据科学》上。
来源:走向数据科学用户:“本文档中绿色突出显示的含义是什么?” RAG 系统:“绿色突出显示的文本被解释为配置设置。”
我们今天期望从检索增强生成 (RAG) 系统中得到各种答案。
在过去的几年里,RAG 已经成为基于知识的语言模型的核心架构构建块之一:RAG 系统不再仅仅依赖于模型中存储的知识,而是将语言模型与外部文档源相结合。
该术语由 Lewis 等人提出,描述了一种广泛用于减少幻觉、提高答案的可追溯性以及使语言模型能够处理专有数据的方法。
我想了解为什么系统选择一个特定的答案而不是非常相似的替代方案。这个决定通常在检索阶段就已经做出,早在法学硕士发挥作用之前。
因此,我在本文中进行了三个实验来研究不同的块大小(80、220、500)如何影响检索行为。
目录1 – 为什么块大小不仅仅是一个参数2 – 块大小如何影响小型RAG 系统中检索结果的稳定性?3 – 无输出生成的最小RAG 系统4 – 三个实验:块大小作为变量5 – 最终想法
1 – 为什么块大小不仅仅是一个参数
在典型的 RAG 管道中,文档首先被分割成更小的文本段,嵌入到向量中,并存储在索引中。当发出查询时,将检索语义相似的文本段,然后将其处理为答案。最后一步通常与语言模型结合执行。
RAG 系统的典型组件包括:
在本文中,我重点关注检索步骤。此步骤取决于几个参数:
嵌入模型的选择: 距离或相似度度量: 检索到的结果数(Top-k):