生成检索使用给定查询的序列到序列体系结构以端到端的方式生成相关文档的标识符。尚未完全理解生成检索和其他检索方法之间的关系,尤其是基于密集检索模型中匹配的方法之间的关系。先前的工作表明,使用原子标识符的生成检索等效于单载体密集的检索。因此,生成检索表现出类似于在使用层次语义标识符时,在树索引中类似于层次搜索的行为。但是,先前的工作仅关注检索阶段,而没有考虑生成检索的解码器内的深层相互作用。在本文中,我们通过证明生成检索和多向量密集检索共享相同的框架,以衡量与文档查询的相关性相同的框架。具体来说,我们研究了生成检索的注意力层和预测头,表明可以将生成检索理解为多向量密集检索的特殊情况。两种方法都将相关性计算为查询和文档向量的产品和对齐矩阵的总和。然后,我们探讨了生成检索如何应用此框架,采用不同的策略来计算文档令牌向量和对齐矩阵。我们已经进行了实验来验证我们的结论,并表明两个范式在其比对矩阵中表现出术语匹配的共同点。
主要关键词