摘要 - 在分析无人机空中图像时,对象检测任务特别具有挑战性,尤其是在存在复杂的地形结构,目标大小的极端差异,次优射击角度和不同的照明条件下,所有这些都加剧了识别困难。近年来,基于变压器体系结构的DITR模型消除了传统的后处理步骤,例如NMS(非最大抑制作用),从而简化了对象检测过程并提高了检测准确性,这在学术界引起了广泛的关注。但是,DETR具有诸如慢训练收敛,查询优化难度和高计算成本等局限性,这阻碍了其在实际领域的应用。要解决这些问题,本文提出了一个称为Optideter的新对象检测模型。该模型首先采用了更有效的混合编码器来替换传统的跨前期编码器。新的编码器通过内部和跨尺度特征交互和融合逻辑显着增强了特征处理能力。其次,引入了一个意识选择机制的IOU(与联合的交集)。这种机制在训练阶段增加了约束,以为解码器提供更高质量的初始对象查询,从而显着改善了解码性能。此外,Optidetr模型还将SW-Block集成到DETR DE-DE-DE-DE-DE-DE-DE-DE-编码器中,利用Swin Transformer在全局上下文建模和功能表示中的优势,以进一步提高对象检测的性能和效率。为了解决小物体检测的问题,本研究对SAHI算法进行了创新的数据进行数据增强。通过一系列实验,与当前主流对象检测模型相比,它在地图(平均平均精度)度量中实现了超过两个百分点的性能。此外,计算和记忆消耗的降低显着降低,证明了Optideter在对象检测任务中的出色性能和实践价值。
主要关键词