摘要 — 量子消息的量子私有信息检索 (QPIR) 是一种协议,用户从一台或多台服务器检索多个量子状态之一,而无需透露检索到的状态。我们在两种不同的设置中考虑 QPIR:盲设置,其中服务器包含消息状态的一个副本;以及可见设置,其中服务器包含消息状态的描述。在这两种设置中,一个简单的解决方案是从服务器下载所有状态,本文的主要目标是找到更高效的 QPIR 协议。首先,我们证明简单解决方案对于盲设置中的单服务器 QPIR 是最优的。在单轮协议中,即使在可见设置中,相同的最优性也成立。另一方面,当用户和服务器共享纠缠时,我们证明在盲设置中存在一个高效的单服务器 QPIR 协议。此外,在可见设置中,我们证明可以构建对称 QPIR 协议,其中用户不会获得非目标消息的任何信息。我们为纯态构建了三个双服务器对称 QPIR 协议。请注意,如果没有用户未知的共享随机性,对称经典 PIR 是不可能的。
允许免费复制本作品的全部或部分以供个人或课堂使用,但不得出于营利或商业目的而复制或分发,且副本首页必须注明此声明和完整引文。必须尊重 ACM 以外的人拥有的本作品组成部分的版权。允许摘要并注明出处。若要复制、重新发布、发布到服务器或重新分发到列表,则需要事先获得特定许可和/或支付费用。请向 permissions@acm.org 申请许可。
抽象的机上计算机学习(ML)推理可以在无需向远程服务器揭示的用户设备上使用私人用户数据。但是,对于依靠嵌入太大而无法存储在设备上的许多应用程序的应用程序,纯粹的私人ML推理解决方案是不切实际的。特别是,建议模型通常在1-10 GB的数据下使用多个嵌入式表,这使得它们不切实际地存储在设备上。为了超越这个障碍,我们建议使用私人信息检索(PIR)有效,私人地从服务器中嵌入嵌入,而无需共享任何私人信息。由于现成的PIR算法通常过于计算,因此很密集,无法直接用于潜伏敏感的推理任务,我们1)提出了基于GPU的新型PIR加速度,以及2)与下游ML的pir共同设计PIR,以获得进一步的加速。我们的GPU加速策略将系统吞吐量提高了20倍以上,超过了CPU PIR实现,而我们的PIR-ML共同设计在固定模型质量下提供了超过5倍的额外吞吐量改进。,对于各种设备上的ML插图,例如建议和语言建模,我们的单个V100 GPU上的系统每秒可提供高达100,000的查询 - 基于CPU的基线,A> 100×吞吐量改进 - 在基于CPU的基线上 - 维护模型准确性。
摘要 — 本研究探讨了将检索增强生成 (RAG) 集成到已使用混合专家 (MoE) 的 Mistral 8x7B 大型语言模型 (LLM) 中,以解决其在复杂信息检索和推理任务中现有的局限性。通过利用 Google BIG-Bench 数据集,我们进行了广泛的定量和定性分析,以评估增强模型的性能。结果显示准确率、精确率、召回率和 F1 分数均有显著提高,凸显了增强模型在生成语境丰富、准确且细致入微的响应方面的卓越能力。这种集成展示了一种克服传统 LLM 固有局限性的有希望的方法,标志着人工智能研究的关键进展。我们的研究结果有助于持续开发更具适应性、更高效、更智能的人工智能系统,为人工智能在各个领域的应用开辟新的途径。该研究承认与数据集范围和计算需求相关的限制,并为未来的研究提出了进一步完善和扩展模型适用性的方向。
简介 在不久的将来,我们不会输入命令或说出命令,而是会思考它们。目前,脑机接口已投入使用,并且有可能从使用功能性磁共振成像 (fMRI) 获得的大脑活动记录中生成正在默读的内容的记录 (Tang 等人2023)。最近,已证明使用脑电图 (EEG) 成像进行神经记忆解码是可能的 (Bruns、Haidar 和 Rubino 2023)。神经记忆解码是从大脑数据重建心理回忆的概念。这一发现很重要,因为与 fMRI 不同,EEG 设备价格低廉且舒适。消费者可以购买 EEG 设备并在一天中的大部分时间佩戴它们。使用消费级 EEG 设备进行神经记忆解码表明了一系列令人兴奋的应用。神经信息检索就是这样一种应用。随着互联网上可用的信息越来越多,找到以前遇到过的文档成为一个难题。创建和存储书签不是一个好的解决方案,因为用户创建的标签或关键字是主观的并且很难创建。重新搜索文档的替代方案可能很困难且耗时。使用神经信息检索,只需思考一下就可以检索曾经看到的信息。在此应用程序中(见图1),用户在找到有用的文档或网站后,会在记录简短的 EEG 时对其进行短暂的思考。稍后,为了检索文档,用户在脑电图再次显示时简要回忆文档的内容
研究方向:本报告概述了具有高智力价值和更广泛影响的 IR-GenAI 系统的八个研究方向:(1)IR-GenAI 中的评估挑战和需求;(2)从隐性和显性的人为反馈中学习,以解决可能需要推理的复杂问题;(3)理解和建模不断发展的生成式 AI 信息访问系统的用户;(4)解决或缓解 IR-GenAI 新技术带来的社会技术问题的挑战和潜在解决方案;(5)开发个性化 IR-GenAI 系统的方法;(6)在开发 IR-GenAI 方法时扩展计算、数据和人力时的效率考虑;(7)信息检索在增强 AI 代理中的作用;(8)专门用于信息访问和发现的基础模型。
大量的时间临床医生花费在患者笔记中进行筛选,并记录了电子健康记录(EHRS)是临床医生倦怠的主要原因。通过在文档过程中积极,动态地检索相关注释,我们可以减少找到相关患者病史所需的努力。在这项工作中,我们将EHR审核日志的使用概念化为机器学习作为在特定时间点特定临床背景下的注释相关性的来源。我们的评估重点是急诊科的动态检索,这是一个具有独特信息检索和笔记写作模式的高敏度设置。我们表明,我们的方法可以达到0.963的AUC,以预测在单个笔记写作会话中将阅读哪些注释。我们还与几位临床医生进行了用户研究,发现我们的框架可以帮助临床医生更有效地检索相关信息。证明我们的框架和方法可以在这种苛刻的环境中表现良好,这是一个有希望的概念证明,它们将转化为其他临床环境和数据方式(例如,实验室,药物,成像)。
最先进的神经检索者主要关注英语等高源语言,这阻碍了他们在涉及其他语言的检索中采用。当前通过杠杆化的多语言审计语言模式,可以证明缺乏非英语语言的高质量标记数据。但是,这些模型需要多种语言的大量特定于任务特定的微调,通常在训练阶段的语料库中以最少的反映语言表现较差,以在培训阶段之后结合新语言。在这项工作中,我们提出了一个新颖的模块化检索模型,该模型从单个高资源语言的丰富数据中学习,并有效地转移到各种语言,从而消除了对语言特定标记的数据的需求。我们的模型Colbert-XM展示了与现有的最新的多语言检索器相对的性能,这些猎犬在更广泛的数据集中以各种语言进行了培训。进一步的分析表明,我们的模块化方法具有高度的数据效率,有效地适应了分布数据,并大大减少了能耗和碳排放。通过证明其在零拍摄的Sce-Narios中的熟练程度,Colbert-XM标志着向更可持续和包容的检索系统的转变,从而使有效的信息可以使用多种语言获得。我们将公开发布社区的代码和模型。
摘要 量子计算 ( QC ) 是计算科学中一个新兴领域,由于其具有开创性应用的潜力,吸引了大量研究兴趣。事实上,人们相信 QC 可以通过显著减少解决问题所需的时间来彻底改变我们解决非常复杂问题的方式。尽管 QC 仍处于发展的早期阶段,但已经可以使用量子计算机解决一些问题,从而开始看到它的潜力。因此,QuantumCLEF 实验室的目标是提高人们对 QC 的认识,并开发和评估新的 QC 算法,以解决在实现信息检索 ( IR ) 和推荐系统 ( RS ) 时通常面临的挑战。此外,这个实验室为人们提供了一个接触 QC 技术的好机会,由于这些技术还处于早期发展阶段,因此通常不易获得。在本文中,我们概述了 QuantumCLEF 的第一版,该实验室专注于应用量子退火 ( QA ),一种特定的 QC 范例,来解决两个任务:IR 和 RS 系统的特征选择,以及 IR 系统的聚类。共有 26 个团队注册了该实验室,最终有 7 个团队按照实验室指南成功提交了他们的运行。由于主题新颖,我们为参与者提供了许多示例和全面的材料,以帮助他们了解 QA 的工作原理以及如何编写量子退火程序。