获取独家产品信息,尽享促销优惠!立即订阅,不容错过
* 限···时··优惠
多标签属性识别是计算机视觉中的一项关键任务,应用程序范围在不同的领域。这个问题通常涉及检测具有多个属性的对象,需要具有高级差异和精细的特征提取的复杂模型。对象检测和属性识别的集成通常依赖于诸如双阶段网络之类的方法,其中准确的预测取决于高级特征提取技术,例如感兴趣的区域(ROI)池。为了满足这些要求,在统一框架中既可以实现可靠的检测和属性进行分类,这是必不可少的。这项研究介绍了一个创新的MTL框架,旨在将多人属性识别(MPAR)纳入单模型体系结构中。命名为MPAR-RCNN,该框架通过空间意识到的,共享的骨干,促进效果和准确的多标签预测来符合对象检测和属性识别任务。与传统的基于快速区域的卷积神经网络(R-CNN)不同,该网络(R-CNN)分别管理人的检测和归因于双阶段网络的分类,MPAR-RCNN体系结构在单个结构中优化了两个任务。在更宽的(用于事件识别的Web图像数据集)数据集上进行了验证,提出的模型展示了对当前最新ART(SOTA)体系结构的改进,展示了其在推进多标签属性识别方面的潜力。