11 天前

视锥-PointPillars:一种基于RGB相机与LiDAR的多阶段3D目标检测方法

{Christian Laugier, Özgür Erkent, David Sierra-Gonzalez, Anshul Paigwar}
视锥-PointPillars:一种基于RGB相机与LiDAR的多阶段3D目标检测方法
摘要

精确的三维物体检测是自动驾驶车辆感知模块中的关键组成部分。对三维环境中物体的深入理解有助于实现更优的决策与路径规划。在自动驾驶车辆中,RGB相机与激光雷达(LiDAR)是最常用的环境感知传感器。尽管基于RGB图像的二维物体检测方法已取得诸多令人瞩目的成果,但在大规模场景的三维点云中高效定位小型物体(如行人)仍是当前研究中的一个挑战性课题。本文提出一种新颖的基于LiDAR数据的三维物体检测方法——Frustum-PointPillars。该方法并未完全依赖点云特征,而是充分利用成熟的二维物体检测技术,以缩小三维空间中的搜索范围。随后,在缩减后的点云数据上,采用柱状特征编码网络(Pillar Feature Encoding)实现物体的精确定位。此外,我们还提出一种新型的点云掩码策略,进一步提升物体定位的准确性。我们在KITTI数据集上训练所提出的网络,并通过实验验证了其有效性。在KITTI测试集上,本方法在三维行人检测(鸟瞰图视角)任务中超越了现有的多传感器最先进(SOTA)方法,同时实现了高达14 Hz的运行速度,显著提升了推理效率。