在书籍搜索中,应返回有关查询的相关书籍信息。书籍包含复杂的,多方面的信息,例如元数据,大纲和主要文本,其中大纲在章节和各节之间提供了层次的信息。生成检索(GR)是一种新的检索范式,将语料库信息固定到单个模型中,以生成与给定查询相关的文档标识符。如何将GR应用于书籍搜索?直接将GR应用于书籍搜索是一个挑战,因为书籍搜索的独特特征:(i)该模型需要保留该书的复杂,多面信息,从而增加了对标记数据的需求。(ii)将书籍信息分开并将其视为单独的学习部分的集合,可能会导致层次信息的丢失。我们为B OOK S EARCH(GBS)提出了一个有效的G能量检索框架,该框架具有两个主要组成部分:(i)数据元素和(ii)面向轮廓的书籍编码。为了进行数据增强,GBS构建了多个查询书对培训;它根据大纲,各种形式的书籍内容构建了多个书籍标识符,并模拟了带有多样化的伪Queries的真实书检索场景。这包括启动覆盖范围的书标识符的增强,允许该模型学会索引
((Aged[Mesh] 或 Aging[Mesh] 或 Aged[Text Word] 或 aging[Text Word] 或 Elder*[Text Word] 或 “old adult*”[Text Word] 或 “older adult*”[Text Word] 或 “old person*”[Text Word] 或 “older person*”[Text Word] 或 “old individual*”[Text Word] 或 “older individual*”[Text Word] 或 “old people”[Text Word] 或 geriatr*[Text Word] 或 “independent living”[Mesh Terms] 或 “independent living”[Text Word] 或 “healthy aging”[Mesh] 或 “healthy aging”[Text Word] 或 healthy[Text Word]) AND (Exercise[Mesh] 或 Exercise[Text Word] 或 “physical activity”[Text Word] 或 “physical exertion”[MeSH] 或 “physical exertion”[Text Word] 或 “physical fitness”[Mesh] 或 “Physical Education and Training”[Mesh] 或“体育教育与训练”[Text Word] 或 “体育教育”[Text Word] 或 “体育训练”[Text Word] 或 “体能训练”[Text Word] 或 “体能训练”[Mesh] 或 “体能训练”[Text Word]) AND (mhealth[Text Word] 或 “m-health”[Text Word] 或 “移动健康”[Text Word] 或 “可穿戴技术*”[Text Word] 或 “智能手机*”[Text Word] 或 “移动应用*”[Text Word] 或 应用*[Text Word] 或 webapp*[Text Word] 或 ehealth[Text Word] 或 “电子健康”[Text Word] 或 远程医疗[Text Word]))
作为供应链的复杂性和动态挑战传统管理方法,集成大型语言模型(LLM)和知识图(KGS)是推进供应链分析的有前途的方法。本文提出了一种方法,该方法旨在利用LLMS和KGS之间的协同作用,特别着眼于增强供应商发现实践。主要目标是将大量的非结构化供应商能力数据转换为统一的KG,从而改善供应商的发现过程并增强制造商的可访问性和发现性。通过本体驱动的图形构建过程,提出的方法将KGS和基于LLM的先进的自然语言处理技术整合在一起。借助详细的案例研究,我们展示了这种综合方法不仅如何提高答案质量并提高中小型制造商的可见性,还可以增强敏捷性,并为供应链管理提供战略见解。[doi:10.1115/1.4067389]
本文介绍了一种创新的检索增强生成方法,以进行相似性搜索。所提出的方法使用生成模型来捕获细微的语义信息并基于高级上下文理解检索相似性分数。该研究重点介绍了包含从生物医学领域提取的100对句子的生物群数据集,并引入了相似性搜索相关结果,这些结果优于先前在该数据集上获得的句子。通过对模型敏感性的深入分析,研究确定了最佳条件,导致最高相似性搜索准确性:结果揭示了较高的Pearson相关评分,在0.5的温度下达到0.905,并且提示中提供的20个示例的样本大小为20个示例。这些发现强调了生成模型进行语义信息检索的潜力,并强调了相似性搜索的有希望的研究方向。
由肢体损失,衰老,中风和其他运动缺陷造成的移动性障碍是全球数百万个人面临的重大挑战。先进的辅助技术,例如假肢和矫形器,有可能大大改善此类个人的生活质量。这些技术设计中的关键组成部分是对肢体受损的参考联合运动的准确预测,这受到这些患者可用的关节运动数据的稀缺性的阻碍。为了解决这个问题,我们提出了一种新型的模型,重新利用了深度学习的重新编程属性,结合了网络反转原理和检索绘制的映射。我们的方法适应了最初为健全的个体设计的模型,以预测肢体受损患者的关节运动,而不会改变模型参数。我们通过广泛的经验研究对低于膝盖挑战的患者的数据进行了广泛的经验研究,证明了重新映射的功效,从而证明了对传统转移学习和微调方法的显着改善。这些发现对截肢,中风或衰老的患者的辅助技术和流动性具有显着影响。
文本到SQL通过使非专家将其自然语言(NL)问题转换为结构化查询语言(SQL)查询来简化数据库交互。随着大语言模型(LLM)的进步,内在学习(ICL)已成为构建文本到SQL系统的流行选择。现实世界,行业规模的数据库通常包括表和数百列的桌子,并使整个模式将整个模式作为LLM的上下文不可估量昂贵。此要求访问正确的数据库和表集。最近提出了基于增强的增强剂(RAG)方法,用于检索给定查询的数据库和表的相关子集。但是,我们观察到,现有的合成查询生成方法可以产生主要简单的查询,这些查询可能无法充分代表复杂的现实世界查询,因此对生成的SQL的质量产生负面影响。为了解决这个问题,我们提出了一种基于创新的内在强化学习(ICRL)的框架,该框架通过增强模型生成了实践者在推理期间可能构成的复杂查询的能力来完善问题的生成过程。与现有方法相反,我们的框架与多样化和复杂的合成SQL查询产生。我们通过多个实验与公共标准数据集中的代表性最先进模型进行了比较,揭示了我们的方法的有效性,并观察到性能和可伸缩性的实质性提高。与用于识别模式的最新模型相比,数据库/表检索任务中的回忆提高了15-20%,而SQL生成的执行精度高达2%。
进行大规模研究以从多个设施中收集大脑MR图像时,在每个站点的成像设备和协议中的差异的影响不容忽视,并且近年来,该域间隙已成为一个重要的问题。在这项研究中,我们提出了一种称为样式编码器对抗域的适应(SE-ADA)的新的低维表示(LDR)施加方法,以实现基于内容的图像检索(CBIR)的大脑MR图像。se-ADA通过将特异性信息与LDR分开,并使用对抗性学习来最大程度地减少域差异,从而减少了域差异。在评估实验中,将SE-ADA与八个公共大脑MR数据集(ADNI1/2/3,OASIS1/2/3/4,ppmi)进行比较的域进行了比较,SE-ADA有效地删除了域信息,同时保留了原始大脑结构的关键方面并证明了最高疾病搜索的准确性。
意大利信息检索研讨会 (IIR) 于 2010 年创办,现已进入第 14 届,旨在为介绍和讨论信息检索理论和实证研究提供一个平台。自首次在帕多瓦举办以来,IIR 已成为研究人员(尤其是早期学者)以及对信息检索感兴趣的行业专业人士的重要论坛,他们可以在协作和非正式的环境中交流、分享想法并讨论他们的工作。多年来,研讨会除了讨论搜索和排名之外,还开放了各种研究领域的讨论,包括内容表示和分析、个性化搜索和推荐、对话系统和特定领域的应用、通过研究人为因素和界面实现可用性,以及开发信息检索系统和 RS 的评估方法。自首次举办以来,IIR 每年都由该领域的领先研究小组组织举办。该研讨会曾在国内外举办过:帕多瓦(2010 年和 2019 年)、米兰(2011 年和 2022 年)、巴里(2012 年和 2021 年)、比萨(2013 年和 2023 年)、罗马(2014 年和 2018 年)、卡利亚里(2015 年)、威尼斯(2016 年)和卢加诺(2017 年)。本活动报告的组织方式如下。我们首先概述 IIR 2024 的关键方面(第 2 部分),包括目标、主题、组织和收到的贡献概述。接下来,我们简要描述研讨会上提出的每一项贡献(第 3 部分)。最后,我们重点介绍新兴的研究趋势和其他相关见解(第 4 部分)。
第二次世界大战后,世界各地开始开设大量电影资料馆,国际电影档案联合会 (FIAF) 的活动也恢复了活力,促进了展览巡回,公众通过展览重新接触档案电影 (Tadeo Fuica 2019: 28–32)。这促使人们质疑当时之前电影史的书写方式,并引发了一场深刻的史学辩论。为了回应莫里斯·巴代什 (Maurice Bardèche) 和罗伯特·布拉西拉赫 (Robert Brasillach) (1935) 等人撰写的历史,这些历史大多基于电影爱好者的记忆,乔治·萨杜尔 (George Sadoul) (1946, 1947, 1948, 1949) 和让·米特里 (Jean Mitry) (1968) 等作家发展了更为严格的方法论,强调了观看电影和情境化的重要性 (Louis 2020: 117–30)。几十年后,档案保管员需要保存其资料,而学术界又愿意重新接触历史方法,这两者相结合,为该领域的新转折做好了准备(Elsaesser 2012:592-93)。1978 年布莱顿 FIAF 大会被广泛认为是实现这一变化的事件,因为它为学者们提供了观看早期电影档案片段的机会(Gaudreault 等人 2012:3)。与档案珍宝的接触使研究人员能够重新审视当时一直沿用的目的论方法,这种方法将早期电影边缘化并低估了其价值(Gaudreault 和 Gunning 1989)。这次大会还强调了档案保管员和历史学家之间合作的必要性,以推动该学科的发展(Gaudreault 2006,Gunning 2006)。
在信息检索(ir)中,除其他应用外,LLMs被积极探索,以进行定时查询文件相关性,包括排名和标签生成[Rahmani等。,2024a; Craswell等。,2024]。后者可用于培训和评估其他功能不力但更有效的排名者。llms用于行业中的相关性标签[Thomas等。,2023]。评估方法将更广泛的LLM和提示应用于标签问题,可能会解决更广泛的质量问题。是在这些观察结果的推动下,我们认为在LLMS背景下的评估策略研讨会会质疑IR和NLP是否真正面临评估策略的范式转变。因此,我们组织了这个研讨会,以通过信息检索镜头对基于LLM的评估提供新的视角。研讨会还提供了一个机会,以反思学术界和行业中基于LLM的评估的好处和挑战。最后,我们鼓励有关进一步评估主题和模型的提交和讨论,而现有文献很少,例如推荐系统,学习排名和扩散模型。本文是我们自己的llm4eval的事件报告[Rahmani等。,2024b]事件,这是与Sigir 2024结合举行的信息检索评估大语模型的第一个用于评估(LLM4EVAL 2024)的研讨会。研讨会举行了一个海报会议,并带有公认的论文和小组讨论。我们报告了如何组织研讨会(第2节),提供有关研讨会(第3节)发生的情况的描述性说明,并报告我们从LLMJudge挑战中学到的东西(第4节)。