详细内容或原文请订阅后点击阅览
Vector RAG 还不够 - 我为多代理内存构建了上下文图形层
我在相同的多代理对话上对原始聊天历史记录、纯矢量 RAG 和上下文图进行了基准测试。结果暴露了关系检索中的一个令人惊讶的弱点。Vector RAG isn't Enough — I Building a Context Graph Layer for Multi-Agent Memory 首先出现在 Towards Data Science 上。
来源:走向数据科学促使我构建这个的问题
我构建了一个三代理管道,非常适合短期任务。但当谈话一拖再拖,特工需要回忆起过去的决定时,整个事情就崩溃了。
下面是它的具体情况:Agent_Planner 将决定该项目应该使用 PostgreSQL。然后,二十个“听起来不错”和“我会做的”就会过去。最终,Agent_Reviewer 会开口询问我们正在使用什么存储技术。即使整个原始记录都位于上下文窗口中,代理也无法可靠地回答。
我在本地运行这个管道,作为 EmiTechLogic 的一个副项目,只是为了看看在多代理协调遇到困难之前我能将其推进多远。事实证明,这并没有花很长时间。
最初,我认为这只是一个模型限制。事实并非如此。这是一个内存架构问题,通常会引发两个令人头疼的问题之一,具体取决于您如何尝试修复它。
替代修复:向量搜索和关系陷阱
两种方法都达到了不同的结构上限。我没有猜测哪种折衷方案“足够好”,而是决定对它们两者进行衡量。
