代理 RAG 与经典 RAG:从管道到控制循环

根据用例的复杂性、成本和可靠性要求在单通道管道和自适应检索循环之间进行选择的实用指南代理 RAG 与经典 RAG:从管道到控制循环首先出现在走向数据科学上。

来源:走向数据科学

:为什么这种比较很重要

RAG 从一个简单的目标开始:将模型输出置于外部证据中,而不是仅仅依赖于模型权重。大多数团队将其实现为管道:检索一次,然后生成带有引用的答案。

去年,越来越多的团队开始从“一次传递”管道转向类似代理的循环,当第一次传递较弱时,可以重试检索和调用工具。Gartner 甚至预测,到 2028 年,33% 的企业软件应用程序将包含代理 AI,这表明“代理”模式正在成为主流而不是利基市场。

Agentic RAG 改变系统结构。检索变成一个控制循环:检索、推理、决定,然后再次检索或停止。这反映了“理性与行动”方法的核心模式,例如 ReAct,系统在推理和行动之间交替以收集新证据。

然而,代理不会在没有权衡的情况下增强 RAG。引入循环和工具调用提高了适应性,但降低了可预测性。在调试流程而不是单个检索步骤时,正确性、延迟、可观察性和故障模式都会发生变化。

经典 RAG:管道心智模型

经典 RAG 很容易理解,因为它遵循线性过程。收到用户查询后,系统检索一组固定的段落,模型根据该单个检索生成答案。如果出现问题,调试通常集中在检索相关性或上下文组装上。

在较高层次上,管道如下所示:

  • 查询:将用户问题(以及任何系统指令)作为输入
  • 检索:获取 top-k 相关块(通常通过向量搜索,有时是混合搜索)
  • 组合上下文:选择最佳段落并将其排列到提示上下文中(通常会重新排序)
  • 生成:生成一个答案,最好引用检索到的段落
  • 经典RAG擅长什么

    示例(经典 RAG 实践):

    用户问:“MAX_UPLOAD_SIZE 配置标志有什么作用?”