摘要 - 鸟眼视图中的3D对象检测(BEV)空间最近已成为自主驾驶领域的一种普遍方法。与透视图方法相比,尽管准确性和速度估计的改善有所提高,但现实世界自动驾驶汽车中基于BEV的技术的部署仍然具有挑战性。这主要是由于它们依赖基于视觉转化器(VIT)的架构,该体系结构引入了相对于输入分辨率的二次复杂性。为了解决这个问题,我们提出了一个有效的基于BEV的3D检测框架,称为Bevenet,该框架利用了仅卷积的架构建筑设计来规避VIT模型的局限性,同时保持基于BEV的方法的有效性。我们的例子表明,在Nuscenes挑战中,Bevenet比现代的最新方法(SOTA)快速(SOTA)方法,达到0.456的平均平均精度(MAP)为0.456,NUSCENES检测分数(NDS)的平均精度(MAP)为0.555在Nuscenes验证验证数据上,均为0.555,并使用persenter firames perference Speets perspersy Specters perspersy perspersy perspersy prement perspersy prement per per per 47。据我们所知,这项研究是第一个实现基于BEV的方法的重大效率提高的研究,强调了它们对现实世界自动驾驶应用程序的可行性的增强。