摘要 —描述图像的视觉语义内容是提高场景图像识别能力的一种有效而直接的方法。语义多项式 (SMN) 表示就是这样一种表示,它使用概念的后验概率来捕获语义信息。获取 SMN 表示的核心部分是构建概念模型。为了构建概念模型,必须为图像中存在的每个概念提供基本事实 (真实) 概念标签。由于数据集中的图像数量众多,因此手动标记概念实际上不可行。在这项工作中,我们提出了一种在没有真实概念标签的情况下选择伪概念的方法。我们建议使用弱监督伪概念建模来生成一种基于深度 CNN 的新型 SMN 表示。在这种方法中,来自更深的卷积层的激活图(过滤器响应)被视为伪概念的线索。我们建议使用伪概念类数据的子空间分析来对相似的伪概念进行分组。在 MIT67 和 SUN397 等标准数据集上的场景识别任务中研究了所提出方法的有效性。
主要关键词