在 SQL 表中的长文本文档上构建经济高效的 Agentic RAG

设计混合 SQL + 矢量检索系统,无需架构更改、数据迁移或性能权衡在 SQL 表中的长文本文档上构建成本高效的代理 RAG 帖子首先出现在走向数据科学上。

来源:走向数据科学

SQL 表上的可靠、低延迟、经济高效的 RAG 系统,可在长文本字段中存储大型文档 - 无需更改现有架构?

这不是一个理论问题。

在大多数企业中,关键业务知识已经存在于传统关系数据库中。提案、报告、合同、文章——全部存储在 TEXT 或 LONGTEXT 列中——设计用于关键字匹配和聚合,而不是语义检索。

随着法学硕士的出现,业务需求已发展为以自然、对话的方式进行结构化计算、深入语义理解和上下文洞察。

例如:

  • 2023 年至 2025 年间,有多少个超过 100 万美元的项目获得批准?
  • 总结过去 6 个月的技术主要趋势
  • 2025 年获奖提案的区别是什么?
  • 它们需要一个检索策略来决定何时计算、何时进行语义搜索以及何时将两者结合起来。在本文中,我将演示直接在传统 SQL 数据库之上运行的 Agentic RAG 架构(无需更改架构),并讨论使其在生产中可靠所需的设计原则。

    系统设置

    对于此插图,我使用了 Social Animal 10K Articles with NLP 数据集的子集,其中包含大量新闻文章和博客文章以及元数据。创建的 SQL 数据库具有以下列 — url、标题、作者、published_date、article_category、word_count 和 full_content。

    标题可以被认为是内容的唯一标识符(主键)。文章类别包括科技、商业、体育、旅游、健康、娱乐、政治和时尚。这些文章在各个类别中分布大致均匀。使用的LLM是gemini-2.5-flash和FAISS来索引和存储向量嵌入。该设计适用于法学硕士或矢量数据库的任何选择。

    架构

    工具如下:

    结果

    主要考虑因素

    结论

    参考