Loading...
机构名称:
¥ 2.0

摘要。虽然生成建模在整个研究领域都普遍存在,但其整合到图像检索领域中仍然在很大程度上没有探索和不合理。在本文中,我们提出了一种新颖的方法,将图像检索重新构图为生成建模的变体,并采用了序列与序列模型。这种方法与当前研究中统一的趋势和谐相吻合,并提出了一个具有凝聚力的框架,可以进行端到端的差异搜索。这又通过直接优化技术促进了出色的性能。我们的模型的开发被称为IRGEN,它解决了将图像转换为简洁的语义单元序列的关键技术挑战,这对于实现效率有效的搜索至关重要。广泛的实验表明,与先前的竞争检索方法相比,我们的模型在三个广泛使用的图像检索基准和200万尺度的数据集上实现了最先进的性能,从而产生了很大的改善。此外,生成建模所促进的精确分数的显着激增列出了绕过重读阶段的潜力,在实际检索工作流程中,这在传统上是必不可少的。该代码可在https://github.com/yakt00/irgen上公开获取。

irgen:图像检索的生成建模

irgen:图像检索的生成建模PDF文件第1页

irgen:图像检索的生成建模PDF文件第2页

irgen:图像检索的生成建模PDF文件第3页

irgen:图像检索的生成建模PDF文件第4页

irgen:图像检索的生成建模PDF文件第5页

相关文件推荐