使用 Amazon Bedrock 模型生成 Gremlin 查询

在这篇文章中,我们探索了一种创新方法,该方法使用 Amazon Bedrock 模型(例如 Amazon Nova Pro)将自然语言转换为 Gremlin 查询,从而帮助业务分析师和数据科学家访问图形数据库,而无需深厚的技术专业知识。该方法涉及三个关键步骤:提取图形知识、构建类似于文本到 SQL 处理的图形,以及通过迭代细化过程生成可执行的 Gremlin 查询,该过程在测试中实现了 74.17% 的总体准确率。

来源:亚马逊云科技 _机器学习
图形数据库彻底改变了组织管理复杂、互连数据的方式。然而,Gremlin 等专门的查询语言通常会给希望有效提取见解的团队带来障碍。与具有明确定义架构的传统关系数据库不同,图数据库缺乏集中式架构,需要深厚的技术专业知识才能进行有效查询。为了应对这一挑战,我们探索了一种使用 Amazon Bedrock 模型(例如 Amazon Nova Pro)将自然语言转换为 Gremlin 查询的方法。这种方法可以帮助业务分析师、数据科学家和其他非技术用户无缝访问图数据库并与之交互。在这篇文章中,我们概述了从自然语言生成 Gremlin 查询的方法,比较了不同的技术,并演示了如何使用大型语言模型 (LLM) 作为评判来评估这些生成的查询的有效性。解决方案概述将自然语言查询转换为 Gremlin 查询需要深入的理解 图结构和封装在图数据库中的特定领域的知识。为了实现这一目标,我们将我们的方法分为三个关键步骤:理解和提取图形知识构建类似于文本到 SQL 处理的图形生成和执行 Gremlin 查询下图说明了此工作流程。步骤 1:提取图形知识成功的查询生成框架必须集成图形知识和领域知识以准确翻译自然语言查询。图知识包含直接从图数据库中提取的结构和语义信息。具体来说,它包括: 顶点标签和属性 – 顶点类型、名称及其关联属性的列表边标签和属性 – 有关边类型及其属性的信息每个顶点的一跳邻居 – 捕获本地连接信息,例如顶点之间的直接关系用此图