使用 Amazon Bedrock Data Automation 以编程方式创建 IDP 解决方案

在本文中,我们将探讨如何以编程方式创建使用 Strands SDK、Amazon Bedrock AgentCore、Amazon Bedrock 知识库和 Bedrock Data Automation (BDA) 的 IDP 解决方案。该解决方案通过 Jupyter 笔记本提供,使用户能够上传多模式业务文档并使用 BDA 作为解析器提取见解,以检索相关块并增强对基础模型 (FM) 的提示。

来源:亚马逊云科技 _机器学习

智能文档处理 (IDP) 改变了组织处理非结构化文档数据的方式,支持从发票、合同和报告中自动提取有价值的信息。今天,我们探讨如何以编程方式创建使用 Strands SDK、Amazon Bedrock AgentCore、Amazon Bedrock 知识库和 Bedrock Data Automation (BDA) 的 IDP 解决方案。该解决方案通过 Jupyter 笔记本提供,使用户能够上传多模式业务文档并使用 BDA 作为解析器提取见解,以检索相关块并增强对基础模型 (FM) 的提示。在此用例中,我们的解决方案从美国教育部的国家报告卡中检索公立学区的相关背景。

Amazon Bedrock Data Automation 可用作独立功能,也可在为检索增强生成 (RAG) 工作流程设置知识库时用作解析器。 BDA 可用于从文档、图像、视频和音频等非结构化、多模式内容中生成有价值的见解。借助 BDA,您可以快速且经济高效地构建自动化 IDP 和 RAG 工作流程。在构建 RAG 工作流程时,您可以使用 Amazon OpenSearch Service 来存储必要文档的向量嵌入。在这篇文章中,Bedrock AgentCore 通过工具利用 BDA 为 IDP 解决方案执行多模式 RAG。

Amazon Bedrock AgentCore 是一项完全托管的服务,允许您构建和配置自主代理。开发人员可以使用流行的框架和一套模型(包括来自 Amazon Bedrock、Anthropic、Google 和 OpenAI 的模型)来构建和部署代理,而无需管理底层基础设施或编写自定义代码。

请遵循以下先决条件和分步实施,在您自己的 AWS 环境中部署解决方案。

先决条件

要遵循示例用例,请设置以下先决条件:

架构

该解决方案使用以下 AWS 服务:

步骤: