图像分割是计算机视觉中的一个基本问题,涉及将图像分为多个段或区域,以简化表示形式,并使其对分析更有意义。在对象识别,医学成像和自动驱动器之类的任务中至关重要,其中理解图像中不同对象的空间组织至关重要[3,4]。在图像分割的背景下经常引用的一项基础工作是Long等。的完全卷积网络(FCN)用于半分割[6]。本文通过对CNN进行适应Pixel的预测而无需任何完全连接的层,从而彻底改变了该领域,从而实现了端到端训练并了解任意大小的图像。这种方法为随后的分割方法中的许多后续发展奠定了基础。变压器模型的引入为处理图像分割任务带来了新的视角,该任务在传统上以卷积网络为主导。Xie等人的Seg-前论文。[7]集成了专门针对半分割需求量身定制的变压器体系结构。segformer在其层次变压器编码中脱颖而出,该编码器有效地处理多尺度特征,对于在准确的分割所需的可变分辨率下捕获详细上下文至关重要。
主要关键词