详细内容或原文请订阅后点击阅览
mirconn:一个设备磁盘居民可更新矢量数据库
最近对密集矢量收集的邻居搜索在信息检索,检索增强发电(RAG)和内容排名中具有重要的应用。在许多现有方法和开源实现的情况下,对大型向量收集进行有效的搜索是一个精心研究的问题。但是,大多数最先进的系统通常针对方案,使用大量内存,无法更新的静态矢量收集以及隔离其他搜索标准的最接近的邻居搜索。我们提出微型邻居…
来源:Apple机器学习研究最近对密集矢量收集的邻居搜索在信息检索,检索增强发电(RAG)和内容排名中具有重要的应用。在许多现有方法和开源实现的情况下,对大型向量收集进行有效的搜索是一个精心研究的问题。但是,大多数最先进的系统通常针对方案,使用大量内存,无法更新的静态矢量收集以及隔离其他搜索标准的最接近的邻居搜索。我们提出微型邻居(micronn),这是一种嵌入式近端近矢量搜索引擎,旨在在低资源环境中可扩展相似性搜索。 Micronn解决了设备矢量搜索的问题,以搜索包含更新和混合搜索查询的实际工作负载,这些问题将最近的邻居搜索与结构化属性过滤器相结合。在这种情况下,内存是高度约束且磁盘有效的索引结构,并且需要算法,并支持连续插入和删除。 Micronn是一个可嵌入的库,可以用最少的资源扩展到大型矢量收集。 MICRONN用于生产中,并为广泛的矢量搜索用例提供动力。 Micronn需要少于7毫秒的时间来检索前100名最近的邻居,同时使用约10 MB的内存,并在公开可用的百万尺度矢量基准中召回了90%的召回。