摘要 - 随着自动驾驶的快速进步,为其感应系统配备更全面的3D感知变得至关重要。但是,广泛探索的任务(例如3D检测或点云语义分段)重点是解析对象(例如汽车和行人)或场景(例如树木和建筑物)。在这项工作中,我们建议解决基于激光雷达的全景分段的具有挑战性的任务,该任务旨在以统一的方式解析对象和场景。特别是我们提出了动态转移网络(DS-NET),该网络是Point Cloud Realm中有效的全景分割框架。ds-net具有用于复杂LIDAR点云分布的动态移位模块。我们观察到,BFS或DBSCAN(例如BFS或DBSCAN)的常用聚类算法无法处理具有非均匀点云分布和不同实例大小的复杂自主驾驶场景。因此,我们提出了一个有效的可学习聚类模块,动态转换,该模块可以随时适应内核功能。为了进一步探索时间信息,我们将单扫描处理框架扩展到其时间版本,即4D-DS-NET,以进行4D Panoptic分割的任务,其中应为多个框架提供相同的ID ID预测。我们建议以更统一的方式求解4D Panoptic分割,而不是将跟踪模块附加到DS-NET上。该代码可在https://github.com/hongfz16/ds-net上公开获取。具体而言,4D-DS-NET首先通过对齐连续的LiDAR扫描来构造4D数据量,然后在其上执行时间统一的实例聚类以获得最终结果。进行了两个大规模自动驾驶激光雷达数据集(Semantickitti和Panoptic Nuscenes)的广泛实验,以证明所提出的溶液的有效性和出色性能。
主要关键词