详细内容或原文请订阅后点击阅览
使用LLMS构建和查询知识图
从文档摄入到智能查询中 - 所有这些都使用开放的工具和指导设置的邮政构建和查询知识图首先出现在数据科学上。
来源:走向数据科学图是相关的
知识图可以定义为以模仿人类理解的方式连接概念,实体及其关系的信息的结构化表示。它通常用于组织和集成来自各种来源的数据,使机器可以更有效地推理,推断和检索相关信息。
在上一篇文章中,我指出,这种结构化表示形式可用于增强和完善LLM在检索增强生成应用中的性能。我们可以将GraphRag作为技术和策略的集合,采用基于图形的知识表示,以更好地将信息提供给LLMS,而与可以采用的“与文档聊天”用例使用的更标准方法相比。
上文中的文章“香草”抹布方法依赖于向量相似性(有时是混合搜索),目的是从矢量数据库的信息(文档块)中检索与用户输入相似的信息,这些信息是根据cesine或cosine或euclidean等相似性措施。然后,这些信息将传递给一个大语言模型,该模型被提示将其用作上下文,以生成用户查询的相关输出。
类似我的论点是,这些应用程序中最大的失败点是相似性搜索依赖于知识库中的明确提及(文档内列表级别),使LLM对文档之间的交叉引用视而不见,甚至是隐含(隐式)和上下文引用。简而言之,LLM受到限制,因为它无法在文档间级别上推理。
内部文档级 Interdocument这可以解决从纯矢量表示和向量存储转变为组织知识库,从每片文本中提取概念并存储的更全面的方式,同时跟踪信息之间的关系。
实体 关系 属性 模块化 k