在043 A高维空间中启用其语义相似性。044但是,此相似性计算过程045面临几个挑战。首先,查询与文档047之间的复杂SE-046摩西关系映射到标量相似性,该标量相似性无法重新触及足够的信息,并且很难在049架上持平(Brito and Iser,2023)。第二,当与长期文档进行交易时,例如具有256、051 512或更多令牌的文件,确定了与查询最相关的第052节,并且对相似性最大的053贡献最高的053是非常可取的,但挑战是挑战 - 054(Luo等人),2024; Günther等。,055 2024)。此外,许多NLP任务,例如SEN- 056 TENCE选择,搜索结果突出显示,针头057在干草堆中(Liu等人。,2024b; An等。,2024; 058 Wang等。,2024)和细粒度引用(Gao 059等人,2023;张等。,2024),需要对文本的深度和060细粒度的理解。061鉴于需要对细粒度的理解的需求,062只是将整个文档与查询保持一致的双重编码器似乎不足,因为它的召开对比损失主要强调全局065语义(Khattab和Zaharia,2020年)。com-066 pllement re-067 Triever的核心定位能力,我们提出了一个新颖而充满挑战的乐趣 - 068 damental问题:我们可以增强和整合069现有070检索器的信息本地化能力而无需牺牲其固有检索能力吗?首先,083072为了应对这些挑战,我们提出了一个073新颖的方法齿轮(ge neration-a u摘要074 r etrieval)。具体来说,我们将数据构建为075(查询文档信息)的三元组,但仍使用076对比度学习来优化相似度为-077 deween the查询和文档。在相同的078时间,我们设计了一个文本解码器,以在文档080中生成Rel-079 Evant Evant Evant-evant Ever-Graining信息,以增强RE-081 recy-081 threval和本地化功能。尽管082概念很简单,但仍有许多挑战。
主要关键词