Loading...
机构名称:
¥ 1.0

在书籍搜索中,应返回有关查询的相关书籍信息。书籍包含复杂的,多方面的信息,例如元数据,大纲和主要文本,其中大纲在章节和各节之间提供了层次的信息。生成检索(GR)是一种新的检索范式,将语料库信息固定到单个模型中,以生成与给定查询相关的文档标识符。如何将GR应用于书籍搜索?直接将GR应用于书籍搜索是一个挑战,因为书籍搜索的独特特征:(i)该模型需要保留该书的复杂,多面信息,从而增加了对标记数据的需求。(ii)将书籍信息分开并将其视为单独的学习部分的集合,可能会导致层次信息的丢失。我们为B OOK S EARCH(GBS)提出了一个有效的G能量检索框架,该框架具有两个主要组成部分:(i)数据元素和(ii)面向轮廓的书籍编码。为了进行数据增强,GBS构建了多个查询书对培训;它根据大纲,各种形式的书籍内容构建了多个书籍标识符,并模拟了带有多样化的伪Queries的真实书检索场景。这包括启动覆盖范围的书标识符的增强,允许该模型学会索引

书籍搜索的生成检索

书籍搜索的生成检索PDF文件第1页

书籍搜索的生成检索PDF文件第2页

书籍搜索的生成检索PDF文件第3页

书籍搜索的生成检索PDF文件第4页

书籍搜索的生成检索PDF文件第5页