本调查探讨了自主驾驶中视觉传播模型的适应,这是受自然语言处理成功启发的转变。超越了在诸如顺序图像过程和超过全球环境中超越卷积神经网络之类的任务中超越传统的经常性神经网络,正如复杂场景识别所证明的那样,变形金刚在计算机视觉中获得了吸引力。这些能力对于实时的自动驾驶至关重要,动态视觉场景处理。我们的表现提供了对自动驱动方面的视觉变压器应用的全面概述,重点是基础概念,例如自我注意力,多头关注和编码器解码器体系结构。我们涵盖了对象检测,分割,行人检测,车道检测等中的应用程序,以比较它们的建筑优点和局限性。该调查以未来的研究方向结束,高度照亮了视觉变形金刚在自主驾驶中的不断增长的作用。
主要关键词