查询为动态3D框,并根据每个查询框生成一组POI。POI是代表3D对象并扮演基本单元在多模式融合中的角色的关键。具体来说,我们将POIS投射到每种模态的视图中,以通过动态融合块在每个POI上集成相应的功能并集成了每个POI的多模态特征。此外,从同一查询框中得出的POI的特征共同汇总到查询功能。我们的方法可以防止视图转换引起的信息损失,并消除了计算密集型的全球关注,从而使多模式3D对象检测器更适用。我们对Nuscenes和Ar-Goversy2数据集进行了广泛的实验,以评估我们的方法。明显地说,所提出的方法在两个数据集上实现了最先进的结果,没有任何铃铛和窃窃私语,即,nscenes上的74.9%NDS和73.4%的地图,Argoverse2上的31.6%CD和40.6%的地图。该代码将在https:// djiajunustc提供。github.io/projects/poifusion。
主要关键词