Amazon Bedrock 的知识库现在支持高级解析、分块和查询重构,从而更好地控制基于 RAG 的应用程序的准确性

Amazon Bedrock 的知识库是一项完全托管的服务,可帮助您实施从提取到检索和快速增强的整个检索增强生成 (RAG) 工作流,而无需构建自定义数据源集成和管理数据流,从而突破了您在 RAG 工作流中可以做的事情的界限。然而,它是 [...]

来源:亚马逊云科技 _机器学习

Amazon Bedrock 知识库是一项完全托管的服务,可帮助您实施从提取到检索和提示增强的整个检索增强生成 (RAG) 工作流,而无需构建自定义数据源集成和管理数据流,从而突破您在 RAG 工作流中可以做的事情的界限。

Amazon Bedrock 知识库 检索增强生成 (RAG)

但是,需要注意的是,在基于 RAG 的应用程序中,当处理大型或复杂的输入文本文档(例如 PDF 或 .txt 文件)时,查询索引可能会产生低于标准的结果。例如,文档的各部分或表格中可能具有复杂的语义关系,需要更高级的分块技术才能准确表示这种关系,否则检索到的块可能无法满足用户查询。为了解决这些性能问题,可以控制几个因素。在这篇博文中,我们将讨论 Amazon Bedrock 知识库中的新功能如何提高使用 RAG 的应用程序的响应准确性。这些功能包括高级数据分块选项、查询分解以及 CSV 和 PDF 解析改进。这些功能使您能够以更高的控制力和精度进一步提高 RAG 工作流程的准确性。在下一节中,让我们介绍每个功能及其优点。

用于提高基于 RAG 的应用程序准确性的功能

在本节中,我们将介绍 Amazon Bedrock 知识库提供的新功能,以提高对用户查询生成的响应的准确性。

高级解析

高级解析是从非结构化或半结构化文档中分析和提取有意义信息的过程。它涉及将文档分解为其组成部分,例如文本、表格、图像和元数据,并识别这些元素之间的关系。

基础模型 (FM) 提高准确性 适应性 提取实体 [1] [2]