自从深度学习在计算机视觉领域出现用于图像分类以来,卷积神经网络 (CNN) 已成为强大而流行的工具。为了更好地识别,人们探索了深度和宽度的维度,从而产生了具有更多层和通道的卷积神经网络。除了这些因素之外,神经生物学还表明横向抑制(横向拮抗,例如马赫带效应),这是一种广泛存在的视觉现象,它增加了横向附近神经元激发的对比度和清晰度,以帮助识别。然而,这种机制在卷积神经网络的设计中还没有得到很好的探索。在本文中,我们明确探索了横向方向上的滤波器维度,并提出了我们的横向抑制启发 (LI) 结构。我们的简单设计使用低通滤波器来模拟来自邻居的横向相互作用的强度衰减。每个通道应用一个可学习的参数来通过乘法设置低通滤波器的幅度,这可以灵活地模拟各种横向相互作用(包括横向抑制)。然后从输入中减去卷积结果,这可以增加对比度和清晰度,从而更好地识别。此外,应用可学习的缩放因子和移位来调整减法后的值。我们的横向抑制启发 (LI) 结构适用于普通卷积和具有残差连接的卷积块,同时与现有模块兼容。初步结果表明,AlexNet (7.58%) 和 ResNet-18 (0.81%) 在 ImageNet 数据集上分别有明显的改进,而参数几乎没有增加,这表明我们的类似大脑的设计从不同角度有效地帮助了图像分类的特征学习。
主要关键词