Loading...
机构名称:
¥ 1.0

人重新识别(REID)旨在在非重叠的摄像机图像中检索相关的人,并且在公共安全领域具有广泛的应用。近年来,随着视觉变压器(VIT)和自我监督的学习技术的发展,基于自我监督的预训练的人的REID的表现得到了极大的改善。人Reid需要提取人体的高度歧视性局部细粒度特征,而传统的VIT则擅长提取与上下文相关的全球特征,从而难以专注于当地的人体特征。为此,本文介绍了最近出现的掩盖图像建模(MIM)自制的学习方法,并通过将掩盖的图像建模和歧视性的损坏性学习和进行训练的人进行训练的任务来有效地提取高质量的全球和本地特征。此人的特征提取方法基于VIT,具有掩盖图像建模(PersonVit)具有无关,可扩展性和强大的概括能力的良好特征,克服了受监督人员REID中难以注释的问题,并在包括MSMT17,Market1501,dukem-comp的公共可用基础数据集中实现了最先进的结果。PersonVit方法的代码和预培训模型将在https://github.com/hustvl/personvit上发布,以促进REID领域的进一步研究。

PersonVit:重新识别的大规模自我监督的视觉变压器

PersonVit:重新识别的大规模自我监督的视觉变压器PDF文件第1页

PersonVit:重新识别的大规模自我监督的视觉变压器PDF文件第2页

PersonVit:重新识别的大规模自我监督的视觉变压器PDF文件第3页

PersonVit:重新识别的大规模自我监督的视觉变压器PDF文件第4页

PersonVit:重新识别的大规模自我监督的视觉变压器PDF文件第5页

相关文件推荐

2024 年
¥2.0
2024 年
¥2.0