Loading...
机构名称:
¥ 1.0

视觉场景是自然组织的,在层次结构中,粗糙的语义递归由几个细节组成。探索这种视觉层次结构对于认识视觉元素的复杂关系至关重要,从而导致了全面的场景理解。在本文中,我们提出了一个视觉层次结构映射器(HI-MAPPER),这是一种增强对预训练的深神经网络(DNNS)结构化理解的新方法。hi-mapper通过1)通过概率密度的封装来调查视觉场景的层次结构组织; 2)学习双曲线空间中的分层关系,并具有新颖的分层对比损失。预定义的层次树通过层次结构分解和编码过程递归地与预训练的DNN的视觉特征相互作用,从而有效地识别了视觉层次结构并增强了对整个场景的识别。广泛的实验表明,Hi-Mapper显着增强了DNN的表示能力,从而改善了各种任务的性能,包括图像分类和密集的预测任务。代码可在https://github.com/kwonjunn01/hi-mapper上找到。

使用夸张的视觉层次结构映射改善视觉识别

使用夸张的视觉层次结构映射改善视觉识别PDF文件第1页

使用夸张的视觉层次结构映射改善视觉识别PDF文件第2页

使用夸张的视觉层次结构映射改善视觉识别PDF文件第3页

使用夸张的视觉层次结构映射改善视觉识别PDF文件第4页

使用夸张的视觉层次结构映射改善视觉识别PDF文件第5页

相关文件推荐

2023 年
¥1.0