目前,放射科医生面临着过大的工作量,这导致他们高度疲劳,并因此导致不必要的诊断错误。决策支持系统可用于确定优先级并帮助放射科医生做出更快的决策。从这个意义上说,基于医学内容的图像检索系统可以通过提供精心策划的类似示例发挥极大的作用。尽管如此,大多数基于医学内容的图像检索系统都是通过查找最相似的图像来工作的,这并不等同于查找疾病及其严重程度最相似的图像。在这里,我们提出了一种可解释性驱动和注意力驱动的医学图像检索系统。我们在一个大型的公开可用的胸部 X 光片数据集中进行了实验,该数据集带有来自自由文本放射学报告 (MIMIC-CXR-JPG) 的结构化标签。我们在两种常见情况下评估了这些方法:胸腔积液和(潜在)肺炎。作为进行评估的地面实况,查询/测试和目录图像由经验丰富的委员会认证的放射科医生进行分类和排序。为了进行深入而全面的评估,其他放射科医生也提供了他们的排名,这使我们能够推断出评分者之间的差异,并得出定性的表现水平。根据我们的地面实况排名,我们还通过计算归一化的折现累积增益 (nDCG) 对所提出的方法进行了定量评估。我们发现,可解释性引导方法优于其他最先进的方法,并且与最有经验的放射科医生的一致性最好。此外,它的表现在观察到的评分者之间的差异范围内。
大规模检索系统(例如搜索连接)一直是帮助人们访问大量在线信息的重要工具。各种技术来提高检索质量。由于从查询文本中进行计算搜索的困难以及准确代表文档要求的语义含义,大多数以前的研究都是基于经典的术语加权方法,例如BM-25(Robertson和Zaragoza,2009年)或TF-IDF(SpärckJones,1972年,1972年,或单词)或单词(MIK)或单词(MIK)或单词。,2013年)在关键字匹配可以解决的情况下表现良好。但是,这些模型仅接受稀疏的手工特征,并且无法捕获复杂的语义效果。考虑到像Bert这样的预训练的语言模型(Devlin等人,2019年)和罗伯塔(Liu等人,2019年)在广泛的
人工智能 (AI) 为药物发现带来了巨大进步,但识别具有最佳物理化学和药理学特性的命中化合物和先导化合物仍然是一项重大挑战。基于结构的药物设计 (SBDD) 已成为一种有前途的范例,但固有的数据偏差和对合成可及性的无知使 SBDD 模型与实际药物发现脱节。在这项工作中,我们探索了两种方法,Rag2Mol-G 和 Rag2Mol-R,它们都基于检索增强生成 (RAG) 来设计适合 3D 口袋的小分子。这两种方法涉及根据生成的小分子在数据库中搜索可购买的类似小分子,或从数据库中可以放入 3D 口袋的新分子中创建新分子。实验结果表明,Rag2Mol 方法始终如一地产生具有优异结合亲和力和药物相似性的候选药物。我们发现 Rag2Mol-R 比先进的虚拟筛选模型提供了更广泛的化学景观覆盖范围和更精确的靶向能力。值得注意的是,这两个工作流程都确定了具有挑战性的靶标 PTPN2 的有希望的抑制剂。我们高度可扩展的框架可以集成各种 SBDD 方法,标志着 AI 驱动的 SBDD 取得了重大进展。代码可在以下网址获取:https://github.com/CQ-zhang-2016/Rag2Mol。
未来调查代理抹布的机会将需要合并多模态数据以产生更丰富的输出。这些应用程序需要更丰富,上下文意识到的响应,并且可以通过这些系统来解决,因为我们使用广泛的数据源(文本,图像,音频)。此外,研究更高级的反馈回路将改善连续学习,以便系统可以更好地处理动态环境。他们可以研究改善反馈的方法以使其快速,并且仍然保持准确。最后,必须探讨跨联盟应用程序和道德AI原则的集成领域,以便这些自适应系统在多个市场中的设计,公平性,透明度和问责制中体现出来。
统一信息提取(UIE)旨在从非结构化文本中提取各种结构化信息。虽然大型语言模型(LLMS)对UIE表现出了希望,但它们需要大量的计算资源,并且经常难以推广到看不见的任务。我们提出了Ruie(基于r Etrieval的U NIDIFIED I NFORMATION e XTRACTION),该框架利用了文本学习以进行有效的任务概括。ruie介绍了一种新颖的演示选择机制,将LLM偏好与关键字增强的模型相结合,并采用了通过对比度学习和知识蒸馏而训练的双重编码猎犬。作为UIE的第一个可训练的检索框架,Ruie是各种LLM的Univer-sal插件。八个持有数据集的实验结果证明了Ruie的有效性,与指导调用方法和其他检索器相比,F1得分的平均改善分别为19.22和3.22。
抽象音乐推荐系统传统上依靠用户的听力历史来提供个性化的轨道建议。但是,由大语言模型(LLMS)提供动力的对话界面的最新进展使用户能够根据语言提示提供高度特定的建议请求(例如“您能推荐一些老式的摇滚民谣放松吗?” )。在这种情况下,轨道建议步骤以生成方式(即推荐音乐曲目的标题是通过简单地预测下一个文本令牌来生成的(例如“齐柏林飞艇 - 通往天堂的楼梯”)。此策略是音乐项目的亚最佳选择,因为:1)它依赖于针对单词而不是项目优化的通用文本令牌化,2)它需要一个额外的实体分辨率层才能找到实际的轨道标识符; 3)解码步骤的数量与艺术家名称和歌曲标题的长度线性缩放,速度降低了,慢速降低。在本文中,我们将基于及时的音乐推荐的任务构架为生成的检索任务,并提出了轨道标识符的新颖有效且有效的表示,这些标识符显着超过了常用的策略。我们介绍了Text2Tracks,这是一种生成的检索模型,可直接从用户的音乐推荐提示中学习映射到相关的轨道ID。Through an offline evaluation on three datasets of playlists with language inputs, we find that (1) the strategy to create IDs for music tracks is the most important factor for the effectiveness of Text2Tracks and that we can significantly outperform the artist name and track name strategy, (2) provided with the right choice of track identifiers, Text2Tracks outperforms sparse and dense retrieval for prompt-based track recommendation, and (3) several design decisions成功地应用于生成检索不会推广到音乐推荐域。
具有20多年的传统,ImageClef基准测试仪为科学界提供了研究活动和评估多模式数据的注释,索引,分类和检索方法。Imageclef 2024与评估论坛(CLEF)[18,19]的会议和实验室集成在一起,第二版由法国格伦诺布尔大学(University of Grenoble Alpes)托管,2024年9月9日至12日,2024年9月20日。考虑到最后四个成功版的经验,Imageclef 2024将处理四个基准测试任务中的多样性,以接近单语言和跨语言信息检索系统的不同方面[14,18,19] [14,18,19] 很少。广告系列目标是多模式数据注释和检索社区以及计算机视觉,图像信息检索和数字图像处理字段的研究人员。从其成立开始,Imageclef却产生了有意义的学术影响,目前,有420个出版物对Web of Science(WOS)有3792篇引用。本文介绍了计划于2024年计划的四个任务,即:ImageClefmedical,ImageCleFrecommeding,参数的图像检索/生成和ImageCleftopicto(图1)。
第 3 章 服务规范 (第 9 条 至 第 15 条) 第 4 章 监督检查和法律责任 (第 16 条 至 第 21 条) 第 5 章 附 则 (第 22 条 至 第 24 条)
图1:体现抹布方法概述。(a)记忆是通过将拓扑图的节点组织到语义森林中来构建的。(b)(a)中的内存可用于查询,并带有并行的树遍历。(c)具有文本输出的导航操作,或者可以为查询生成全局说明,并将检索结果用作LLM上下文。
我们研究低秩相位恢复问题,我们的目标是从一系列无相位线性测量中恢复 ad 1 × d 2 低秩矩阵。这是一个四阶逆问题,因为我们试图恢复通过一些二次测量间接观察到的矩阵因子。我们提出了使用最近引入的锚定回归技术解决该问题的方法。这种方法使用两种不同类型的凸松弛:我们用多面体搜索代替无相位测量的二次等式约束,并通过核范数正则化强制执行秩约束。结果是 d 1 × d 2 矩阵空间中的凸程序。我们分析了两种特定场景。在第一种情况下,目标矩阵为秩 1,观测结构对应于无相位盲反卷积。在第二种情况下,目标矩阵具有一般秩,我们观察一系列独立高斯随机矩阵的内积幅度。在每个问题中,我们都表明,只要我们能够访问质量足够好的锚定矩阵,锚定回归就能从接近最优数量的测量中返回准确的估计值。我们还展示了如何在无相盲反卷积问题中从最优数量的测量中创建这样的锚定,并针对一般秩问题给出了这方面的部分结果。