密集的检索方法在多语言信息检索中表现出了有希望的表现,其中查询和文档可以使用不同的语言。然而,密集的检索器通常需要大量的配对数据,这在多语言方案中带来了更大的挑战。本文介绍了UMR,这是一个未经任何配对数据的训练的ultialual ultilitual contriever r etriever。我们的方法利用了多语言语言模型的序列估计功能,以获取用于培训密集猎犬的伪标签。我们提出了一个两阶段的框架,该框架迭代地改善了多语言密集猎犬的功能。两个基准数据集的实现结果表明,UMR的表现优于监督的基线,展示了训练Mul-listingual语言检索器而没有配对数据的潜力,从而增强了其实用性。1
主要关键词