11 天前
SVGA-Net:基于稀疏体素图注意力机制的点云三维目标检测网络
Qingdong He, Zhengning Wang, Hao Zeng, Yi Zeng, Yijun Liu

摘要
从点云中实现精确的三维物体检测已成为自动驾驶系统中的关键组成部分。然而,以往方法所采用的体素化表示和投影策略难以有效建模局部点集之间的关联关系。为此,本文提出一种新型端到端可训练网络——稀疏体素图注意力网络(Sparse Voxel-Graph Attention Network, SVGA-Net),该网络主要由体素图模块和稀疏到稠密回归模块构成,能够直接从原始激光雷达(LIDAR)数据中实现性能优异的三维目标检测任务。具体而言,SVGA-Net在每个划分的三维球形体素内构建局部完整图,并通过所有体素之间建立全局K近邻(KNN)图,利用局部与全局图结构作为注意力机制,有效增强特征提取能力。此外,提出的稀疏到稠密回归模块通过多层级特征图的融合,进一步提升了三维边界框的估计精度。在KITTI目标检测基准上的实验结果表明,将图结构表示扩展至三维物体检测具有显著有效性,所提出的SVGA-Net在检测精度方面表现优异,达到了具有竞争力的性能水平。