2 个月前

VoxelNet:基于点云的3D目标检测端到端学习方法

Zhou, Yin ; Tuzel, Oncel
VoxelNet:基于点云的3D目标检测端到端学习方法
摘要

在许多应用中,如自主导航、家务机器人和增强/虚拟现实,3D点云中的物体精确检测是一个核心问题。为了将高度稀疏的LiDAR点云与区域提议网络(RPN)对接,现有的大多数研究都集中在手工设计的特征表示上,例如鸟瞰图投影。在这项工作中,我们消除了对3D点云进行手动特征工程的需求,并提出了VoxelNet,一种通用的3D检测网络,该网络将特征提取和边界框预测统一到一个单一阶段的端到端可训练深度网络中。具体而言,VoxelNet将点云划分为等间距的3D体素,并通过新引入的体素特征编码(VFE)层将每个体素内的点组转换为统一的特征表示。这样,点云被编码为描述性的体积表示形式,然后连接到RPN以生成检测结果。在KITTI汽车检测基准上的实验表明,VoxelNet大幅超越了基于LiDAR的现有最先进3D检测方法。此外,我们的网络学习到了不同几何形状物体的有效判别表示,仅基于LiDAR数据,在行人和骑自行车者的3D检测方面也取得了令人鼓舞的结果。