Loading...
机构名称:
¥ 1.0

摘要 - 在本文中,我们指出,基于卷积神经网络(CNN)基于变压器的检测器之间的基本差异,这些检测器在基于变压器的方法中导致小对象的性能较差,是局部信息与全局依赖性在特征提取和传播中的差距。为了使这些差异打扮,我们提出了一种新的视觉变速器,称为Hybrid Network Transformer(Hyneter),此前表明差距导致基于CNN的基于CNN的方法和基于变压器的方法,以增加尺寸不同的对象的结果。不同于以前方法中的分裂策略,Hyneters由混合网络骨干(HNB)和双切换(DS)模块组成,这些模块集成了本地信息和全局,并同时转移它们。基于平衡策略,HNB通过将卷积层嵌入并联中的变压器块中扩展了局部信息的范围,并且DS调整了对斑块外部全局依赖性的过度依赖。消融研究表明,Hyneters通过 + 2的巨大边缘实现了最先进的表现。1〜13。2 AP在可可和 + 3上。 1〜6。 5 miou在visdrone上具有较轻的型号大小和对象检测的计算成本较低。 此外,Hyneters在多个计算机视觉任务上实现了最新的结果,例如对象检测(60。 1 AP在可可和46上。 1 AP在Visdrone上),语义segmentation(54。 3 AP上的ADE20K)和实例分段(48。 可可上的5个ap掩码),并超过以前的最佳方法。2 AP在可可和 + 3上。1〜6。5 miou在visdrone上具有较轻的型号大小和对象检测的计算成本较低。此外,Hyneters在多个计算机视觉任务上实现了最新的结果,例如对象检测(60。1 AP在可可和46上。1 AP在Visdrone上),语义segmentation(54。3 AP上的ADE20K)和实例分段(48。可可上的5个ap掩码),并超过以前的最佳方法。该代码将在以后公开可用。

hyneter:用于多个计算机视觉任务的混合网络变压器

hyneter:用于多个计算机视觉任务的混合网络变压器PDF文件第1页

hyneter:用于多个计算机视觉任务的混合网络变压器PDF文件第2页

hyneter:用于多个计算机视觉任务的混合网络变压器PDF文件第3页

hyneter:用于多个计算机视觉任务的混合网络变压器PDF文件第4页

hyneter:用于多个计算机视觉任务的混合网络变压器PDF文件第5页

相关文件推荐

2025 年
¥1.0
2025 年
¥1.0
2024 年
¥1.0
2020 年
¥1.0
2022 年
¥2.0
2020 年
¥1.0
2020 年
¥2.0
2014 年
¥4.0
2005 年
¥60.0