13 天前

VoxelNeXt:面向3D目标检测与跟踪的全稀疏体素网络

Yukang Chen, Jianhui Liu, Xiangyu Zhang, Xiaojuan Qi, Jiaya Jia
VoxelNeXt:面向3D目标检测与跟踪的全稀疏体素网络
摘要

三维目标检测方法通常依赖于人工设计的代理(如锚框或中心点),并将经过充分研究的二维检测框架迁移到三维场景中。因此,稀疏体素特征需要经过密集化处理,并由密集的预测头进行运算,这不可避免地带来额外的计算开销。本文提出了一种全新的全稀疏三维目标检测框架——VoxelNeXt。其核心思想是直接基于稀疏体素特征进行目标预测,无需依赖人工设计的代理。我们提出的强健稀疏卷积网络VoxelNeXt完全通过体素特征实现三维目标的检测与跟踪,结构简洁高效,无需进行稀疏到密集的转换,也无需非极大值抑制(NMS)后处理。在nuScenes数据集上,该方法在速度与精度的权衡上优于现有主流检测器。本文首次证明,基于全稀疏体素的表示方法在激光雷达三维目标检测与跟踪任务中具有良好的性能表现。在nuScenes、Waymo和Argoverse2等多个基准数据集上的大量实验验证了本方法的有效性。在不依赖任何额外技巧的情况下,我们的模型在nuScenes跟踪测试基准上超越了所有现有的激光雷达检测方法。