向量的关键词检索结果

PINE:秘密共享向量的有效范数边界验证

PINE: Efficient Norm-Bound Verification for Secret-Shared Vectors

高维向量的安全聚合是联合统计和学习中的基本原语。双服务器系统(例如 PRIO)允许可扩展地聚合秘密共享向量。对抗性客户端可能会尝试操纵聚合,因此确保每个(秘密共享)贡献都是格式正确的非常重要。在这项工作中,我们专注于确保每个贡献向量具有有界欧几里得范数这一重要且研究充分的目标。现有的确保有界范数贡献的协议要么会产生很大的通信开销,要么只允许……

使用 GraphRAG 提高检索增强生成准确率

Improving Retrieval Augmented Generation accuracy with GraphRAG

AWS 合作伙伴 Lettria 证明,与仅使用向量的检索方法相比,将基于图形的结构集成到 RAG 工作流中可将答案准确率提高高达 35%。在这篇文章中,我们探讨了为什么 GraphRAG 比单独的向量 RAG 更全面、更易于解释,以及如何使用 AWS 服务和 Lettria 使用此方法。

如何以及为何使用 LLM 进行基于块的信息检索

How and Why to use LLMs for Chunk-Based Information Retrieval

如何以及为何使用 LLM 进行基于块的信息检索检索管道 - 作者提供的图片在本文中,我旨在解释如何以及为何使用大型语言模型 (LLM) 进行基于块的信息检索是有益的。我以 OpenAI 的 GPT-4 模型为例,但这种方法可以应用于任何其他 LLM,例如 Hugging Face、Claude 和其他人的模型。每个人都可以免费访问这篇文章。标准信息检索的注意事项主要概念涉及将文档列表(文本块)存储在数据库中,可以根据某些过滤器和条件进行检索。通常,使用工具来启用混合搜索(例如 Azure AI Search、LlamaIndex 等),它允许:使用 TF-IDF 等词频算法执行基于文本的搜索(

Scikit-fingerprints:用于高效分子指纹计算和与机器学习管道集成的高级 Python 库

Scikit-fingerprints: An Advanced Python Library for Efficient Molecular Fingerprint Computation and Integration with Machine Learning Pipelines

在计算化学中,分子通常表示为分子图,必须将其转换为多维向量才能进行处理,特别是在机器学习应用中。这是使用将分子结构编码为向量的分子指纹特征提取算法实现的。这些指纹对于化学信息学中的任务至关重要,例如化学空间多样性、聚类、虚拟筛选、Scikit-fingerprints:用于高效分子指纹计算和与机器学习管道集成的高级 Python 库首先出现在 AI Quantum Intelligence 上。

代码嵌入:综合指南

Code Embedding: A Comprehensive Guide

代码嵌入是一种将代码片段表示为连续空间中的密集向量的变革性方式。这些嵌入捕获了代码片段之间的语义和功能关系,从而为 AI 辅助编程提供了强大的应用程序。与自然语言处理 (NLP) 中的词嵌入类似,代码嵌入将相似的代码片段在向量空间中紧密定位在一起,[…] 文章《代码嵌入:综合指南》首先出现在 Unite.AI 上。

向量范数简介:L0、L1、L2、L-Infinity

Introduction to Vector Norms: L0, L1, L2, L-Infinity

为什么重要:向量范数:L0 L1 L2 L-Infinity 是数学和机器学习中的基本概念,使我们能够测量向量的大小。

机器学习数学入门

Primer on the math of Machine Learning

1.向量的点积(内积或标量积)2个向量a和b的点积定义为:aT . b ,也可以表示为bT 。 a两个向量 a = [a1, a2, …, an] 和 b = [b1, b2, …, bn] 的点积定义为:{\displaystyle \mathbf {\color {red}a} \cdot \mathbf {\color {blue}b} =\sum _{i=1}^{n}{\color {red}a}_{i}{\color {blue}b}_{i}={\color {red}a}_{1}{\color {blue}b}_{1}+{\color {red}a}_{2}{\color {blu

使用 Keras 进行词嵌入

Word Embeddings with Keras

词嵌入是一种将词汇表中的单词映射到密集实数向量的方法,其中语义相似的单词被映射到附近的点。在此示例中,我们将使用 Keras 为 Amazon Fine Foods Reviews 数据集生成词嵌入。