使用 Amazon Titan Text Embeddings V2、Amazon OpenSearch Serverless 和 Amazon Bedrock 知识库中的二进制嵌入构建经济高效的 RAG 应用程序

今天,我们很高兴地宣布 Amazon Bedrock 知识库和 Amazon OpenSearch Serverless 中推出了 Amazon Titan 文本嵌入 V2 的二进制嵌入。这篇文章总结了这种新的二进制向量支持的好处,并为您提供了入门信息。

来源:亚马逊云科技 _机器学习

今天,我们很高兴地宣布 Amazon Bedrock 知识库和 Amazon OpenSearch Serverless 中推出了 Amazon Titan 文本嵌入 V2 的二进制嵌入。借助 Amazon Bedrock 对二进制嵌入的支持以及 OpenSearch Serverless 中的二进制向量存储,您可以使用二进制嵌入和二进制向量存储在 Amazon Bedrock 知识库中构建检索增强生成 (RAG) 应用程序,从而减少内存使用量和总体成本。

Amazon Titan 文本嵌入 V2 Amazon Bedrock 知识库 Amazon OpenSearch Serverless 检索增强生成

Amazon Bedrock 是一项完全托管的服务,提供单一 API 来访问和使用来自领先 AI 公司的各种高性能基础模型 (FM)。Amazon Bedrock 还提供了广泛的功能来构建具有安全性、隐私性和负责任的 AI 的生成式 AI 应用程序。使用 Amazon Bedrock 知识库,FM 和代理可以从您公司的私有数据源中检索上下文信息以供 RAG 使用。RAG 可帮助 FM 提供更相关、更准确和更定制化的响应。

Amazon Bedrock 生成式 AI

Amazon Titan 文本嵌入模型可生成文档、段落和句子的有意义的语义表示。Amazon Titan 文本嵌入将文本正文作为输入,并生成 1,024(默认)、512 或 256 维向量。Amazon Titan 文本嵌入通过延迟优化的终端节点调用提供,以实现更快的搜索(建议在检索步骤中使用)和吞吐量优化的批处理作业,以实现更快的索引。借助二进制嵌入,Amazon Titan 文本嵌入 V2 将数据表示为二进制向量,每个维度都编码为单个二进制数字(0 或 1)。这种二进制表示将高维数据转换为更高效的格式以进行存储和计算。

使用 Amazon Titan 文本嵌入 用于矢量引擎的矢量(和 FP16) 选项 Amazon Bedrock 知识库 embeddingTypes invoke_model 嵌入 Amazon S3