基础模型的出现彻底改变了自然语言处理和计算机视觉的领域,为其在自主驾驶(AD)中的应用铺平了道路。本调查对40多篇研究论文进行了全面综述,证明了基础模型在增强广告中的作用。大型语言模型有助于AD的计划和模拟,尤其是由于其在推理,代码生成和翻译方面的熟练程度。并行,视觉基础模型越来越适合于3D对象检测和跟踪等关键任务,并为模拟和测试创建了现实的驾驶场景。多模式基础模型,整合了多种输入,表现出异常的视觉理解和空间推理,对于端到端AD至关重要。这项调查不仅根据其在AD域内的方式和功能进行了结构化的分类单元,对基础模型进行了分类,还可以研究当前研究中使用的方法。它标识了现有的基础模型与剪裁广告方法之间的差距,从而绘制了未来的研究方向并提出了弥合这些差距的路线图。
主要关键词