我们研究低秩相位恢复问题,我们的目标是从一系列无相位线性测量中恢复 ad 1 × d 2 低秩矩阵。这是一个四阶逆问题,因为我们试图恢复通过一些二次测量间接观察到的矩阵因子。我们提出了使用最近引入的锚定回归技术解决该问题的方法。这种方法使用两种不同类型的凸松弛:我们用多面体搜索代替无相位测量的二次等式约束,并通过核范数正则化强制执行秩约束。结果是 d 1 × d 2 矩阵空间中的凸程序。我们分析了两种特定场景。在第一种情况下,目标矩阵为秩 1,观测结构对应于无相位盲反卷积。在第二种情况下,目标矩阵具有一般秩,我们观察一系列独立高斯随机矩阵的内积幅度。在每个问题中,我们都表明,只要我们能够访问质量足够好的锚定矩阵,锚定回归就能从接近最优数量的测量中返回准确的估计值。我们还展示了如何在无相盲反卷积问题中从最优数量的测量中创建这样的锚定,并针对一般秩问题给出了这方面的部分结果。
意大利信息检索研讨会 (IIR) 于 2010 年创办,现已进入第 14 届,旨在为介绍和讨论信息检索理论和实证研究提供一个平台。自首次在帕多瓦举办以来,IIR 已成为研究人员(尤其是早期学者)以及对信息检索感兴趣的行业专业人士的重要论坛,他们可以在协作和非正式的环境中交流、分享想法并讨论他们的工作。多年来,研讨会除了讨论搜索和排名之外,还开放了各种研究领域的讨论,包括内容表示和分析、个性化搜索和推荐、对话系统和特定领域的应用、通过研究人为因素和界面实现可用性,以及开发信息检索系统和 RS 的评估方法。自首次举办以来,IIR 每年都由该领域的领先研究小组组织举办。该研讨会曾在国内外举办过:帕多瓦(2010 年和 2019 年)、米兰(2011 年和 2022 年)、巴里(2012 年和 2021 年)、比萨(2013 年和 2023 年)、罗马(2014 年和 2018 年)、卡利亚里(2015 年)、威尼斯(2016 年)和卢加诺(2017 年)。本活动报告的组织方式如下。我们首先概述 IIR 2024 的关键方面(第 2 部分),包括目标、主题、组织和收到的贡献概述。接下来,我们简要描述研讨会上提出的每一项贡献(第 3 部分)。最后,我们重点介绍新兴的研究趋势和其他相关见解(第 4 部分)。
本报告是作为由美国政府机构赞助的工作的帐户准备的。美国政府或其任何机构,也不是巴特尔纪念研究所,或其任何雇员,对任何信息,设备,产物或程序披露或代表其使用的任何法律责任或责任都没有任何法律责任或责任,或者对其使用的准确性,完整性或有用性都不会侵犯私人权利。以此处参考任何特定的商业产品,流程或服务,商标,制造商或以其他方式不一定构成或暗示其认可,建议或受到美国政府或其任何机构或Battelle Memorial Institute的认可,建议或赞成。本文所表达的作者的观点和观点不一定陈述或反映美国政府或其任何机构的观点和意见。
- 在最坏的情况下,在理想晶格中找到近似最短的向量。- 下一代公开加密的新NIST标准的基础。- 替代结构:近似GCD,NTRU,O(1)-Lank模块LWE
近年来,生成式检索已成为传统检索范式的一种颇具前景的替代方案。它为每个文档分配一个唯一的标识符(称为 DocID),并使用生成模型直接生成与输入查询相关的 DocID。DocID 通常选择一个或多个自然语言序列,例如标题、合成查询或 n-gram,以便有效地利用生成模型的预训练知识。然而,生成式检索是逐个标记生成的,每次解码时仅保留最可能的候选标记,其余标记则被剪枝。因此,如果相关 DocID 中的任何标记被错误地剪枝,检索就会失败。更糟糕的是,在解码过程中,模型只能感知 DocID 中前面的标记,而无法感知后面的标记,因此很容易出现此类错误。为了解决这个问题,我们提出了一种新颖的生成检索框架,称为术语集生成 (TSGen)。我们使用一组术语作为 DocID,而不是序列。这些术语是根据从相关性信号中学习到的权重来选择的,因此它们可以简明扼要地概括文档的语义并将其与其他文档区分开来。在术语集 DocID 的基础上,我们提出了一种排列不变的解码算法,使用该算法,可以以任何排列生成术语集,但始终会指向相应的文档。值得注意的是,TSGen 在每个解码步骤中都会感知所有有效术语,而不仅仅是前面的术语。鉴于解码空间恒定,它可以从更广阔的视角做出更可靠的决策。TSGen 也具有很强的错误抵御能力:只要解码的
摘要 对话式人工智能是计算机科学的一个新兴领域,涉及信息检索、自然语言处理和对话系统等多个研究领域。在这个广阔的领域中,我们专注于对话式信息访问,这个问题特别适合由信息检索社区来解决。我们认为,尽管该领域的研究活动很多,但进展大多局限于组件级改进。当前的努力与真正的对话式信息访问系统之间仍然存在脱节。除了问题本身的挑战性之外,进展缓慢在很大程度上可以归因于缺乏适当的评估方法和资源。本文重点介绍了导致离线和在线评估方法都不适合解决这个问题的挑战,并讨论了使用用户模拟作为可行的解决方案。
简介 在不久的将来,我们不会输入命令或说出命令,而是会思考它们。目前,脑机接口已投入使用,并且有可能从使用功能性磁共振成像 (fMRI) 获得的大脑活动记录中生成正在默读的内容的记录 (Tang 等人2023)。最近,已证明使用脑电图 (EEG) 成像进行神经记忆解码是可能的 (Bruns、Haidar 和 Rubino 2023)。神经记忆解码是从大脑数据重建心理回忆的概念。这一发现很重要,因为与 fMRI 不同,EEG 设备价格低廉且舒适。消费者可以购买 EEG 设备并在一天中的大部分时间佩戴它们。使用消费级 EEG 设备进行神经记忆解码表明了一系列令人兴奋的应用。神经信息检索就是这样一种应用。随着互联网上可用的信息越来越多,找到以前遇到过的文档成为一个难题。创建和存储书签不是一个好的解决方案,因为用户创建的标签或关键字是主观的并且很难创建。重新搜索文档的替代方案可能很困难且耗时。使用神经信息检索,只需思考一下就可以检索曾经看到的信息。在此应用程序中(见图1),用户在找到有用的文档或网站后,会在记录简短的 EEG 时对其进行短暂的思考。稍后,为了检索文档,用户在脑电图再次显示时简要回忆文档的内容