摘要 - 随着对象检测方法的不断增长,本研究探讨了一系列实验,这些实验是基于强化学习(RL)的视觉注意力 - 与显着排名技术的基于显着性和可持续性解决方案。通过整合初始边界框预测的显着性排名,并随后应用RL技术通过在多个时间步中进行有限的动作来完善这些预测,该研究旨在提高RL对象检测准确性。作为一系列实验提出,该研究研究了使用各种图像提取方法的使用,并探讨了基于深度强化学习的本地化代理训练的各种深层Q-Network(DQN)架构变化。此外,我们通过优先考虑轻巧和更快的模型来优化每个步骤中的检测管道,同时还结合了对检测到的对象进行分类的功能,这是先前的RL方法中缺少的功能。我们表明,通过使用Pascal VOC 2007数据集评估这些训练的代理的性能,开发了更快,更优化的模型。值得注意的是,本研究中获得的最佳平均平均精度(MAP)为51.4,超过了文献中基于RL的单个对象检测器设定的基准。索引术语 - 对象检测,计算机视觉,增强学习,显着排名
主要关键词