近年来,研究人员探索了基于强化学习的对象检测方法。但是,现有方法总是几乎没有令人满意的性能。主要原因是当前基于增强学习的方法生成一系列不准确区域而没有合理的奖励函数,并将最终步骤中的非最佳选择视为缺乏有效的区域选择和重新构成策略的检测结果。为了解决上述问题,我们提出了一种新的基于增强的基于基于的对象检测框架,即增强框架,通过将增强剂学习剂与基于卷积神经网络的特征空间整合在一起,具有区域选择的能力并进行了重新确定。在钢筋中,我们重新开发了一个奖励功能,该奖励功能使代理可以有效地训练并提供更准确的区域建议。为了进一步优化它们,我们设计了基于卷积神经网络的区域选择网(RS-NET)和边界框重新填充网络(BBR-NET)。尤其是前者由两个子网络组成:联合网络(IOU-NET)和完整性网络(CPL-NET)共同选择了最佳区域建议。后者旨在将选定的结果重新定义为最终结果。在两个标准数据集Pascal VOC 2007和VOC 2012上的广泛实验结果表明,增强剂能够改善该地区的选择,并学习更好的代理动作表示增强性学习,从而导致最先进的表现。2021 Elsevier B.V.保留所有权利。
主要关键词