从 RAG 到结构：在 GenAIIC 构建真实 RAG 的经验教训 - 第 1 部分 XiaoMi-AI 科研信息收集

详细内容或原文请订阅后点击阅览

从 RAG 到结构：在 GenAIIC 构建真实 RAG 的经验教训 - 第 1 部分

2024年10月24日 18:04 33 Comments

在本文中，我们介绍了 RAG 架构背后的核心概念，并讨论了评估 RAG 性能的策略，既通过指标定量评估，又通过分析单个输出定性评估。我们概述了改进文本检索的几个实用技巧，包括使用混合搜索技术、通过数据预处理增强上下文以及重写查询以提高相关性。

来源:亚马逊云科技 _机器学习

AWS生成AI创新中心（Genaiic）是AWS科学和战略专家的团队，对生成AI有深刻的了解。他们通过建立使用生成AI带来业务价值的概念证据来帮助AWS客户开始生成的AI旅程。自2023年5月AWS Genaiic成立以来，我们目睹了客户对聊天机器人的需求量很高，这些聊天机器人可以提取信息并从庞大且通常是异质的知识库中产生见解。这种用例被称为检索型发电（RAG），从而增强了具有外部数据源的大型语言模型（LLM）知识。

AWS生成AI创新中心（Genaiic）检索 - 杰出的一代（抹布）

这个两部分系列分享了AWS Genaiic从广泛的行业建立抹布解决方案获得的AWS Genaiic获得的见解。您可以将其用作构建更好的抹布解决方案的实用指南。

在第一篇文章中，我们重点介绍了抹布架构的基础以及如何优化仅文本抹布的基础知识。第二个文章概述了如何使用多种数据格式（例如结构化数据（表，数据库）和图像）。

抹布的解剖

rag是通过使用外部数据源为FM提供其他知识的有效方法，并在以下图中描绘：

检索：基于用户的问题（1），从知识库（例如，OpenSearch索引索引）中检索相关信息。授课：添加到FM的信息被添加到FM提示（3.a）中，以增强其知识，以及用户查询（3.b）。Generation：generation：FM生成答案（4）通过提供该提示符（4）在此提示中。

检索：基于用户的问题（1），从知识库（2）中检索相关信息（例如，OpenSearch索引）。

检索

增强：将检索的信息添加到FM提示（3.A）中，以增加其知识，以及用户查询（3.b）。

增强一代

在猎犬中更深的潜水

矢量商店

见解数据格式机器人 AWS 增强生成 GenAIIC AI 快速启动 FM 数据源使用案例解决方案例如文章使用 RAG 构建信息知识库数据库检索生成式