详细内容或原文请订阅后点击阅览
Gemini Embeddings 2 预览版简介
一个嵌入模型来统治它们Gemini Embeddings 2 预览简介一文首先出现在 Towards Data Science 上。
来源:走向数据科学最新嵌入模型的预览版本。该模型之所以引人注目有一个主要原因。它可以嵌入文本、PDF、图像、音频和视频,使其成为一个一站式商店,可以嵌入您想要添加的任何内容。
如果您不熟悉嵌入,您可能想知道所有这些大惊小怪是怎么回事,但事实证明,众所周知,嵌入是检索增强生成或 RAG 的基石之一。反过来,RAG 是现代人工智能处理最基本的应用之一。
RAG 和嵌入的快速回顾
RAG 是一种对信息进行分块、编码和存储的方法,然后可以使用将搜索项与嵌入信息相匹配的相似性函数来搜索这些信息。编码部分将您要搜索的内容转换为一系列称为向量的数字——这就是嵌入的作用。然后,向量(嵌入)通常存储在向量数据库中。
当用户输入搜索词时,它也会被编码为嵌入,并将生成的向量与向量数据库的内容进行比较,通常使用称为余弦相似度的过程。搜索项向量与向量存储中的部分信息越接近,搜索项与所存储的数据的那些部分越相关。大型语言模型可以解释所有这些,并检索并向用户显示最相关的部分。
围绕此还有一大堆其他内容,例如输入数据应如何拆分或分块,但嵌入、存储和检索是 RAG 处理的主要功能。为了帮助您直观地了解,这里有一个 RAG 过程的简化示意图。
那么,Gemini Embedding 有什么特别之处呢?
好的,现在我们知道嵌入对于 RAG 有多重要,为什么 Google 的新 Gemini 嵌入模型如此重要?简单来说就是这个。传统的嵌入模型 — 除了少数例外 — 仅限于文本、PDF 和其他文档类型,也许还可以推送图像。
