17 天前

补丁精炼——局部3D目标检测

Johannes Lehner, Andreas Mitterecker, Thomas Adler, Markus Hofmarcher, Bernhard Nessler, Sepp Hochreiter
补丁精炼——局部3D目标检测
摘要

我们提出了一种名为“Patch Refinement”的两阶段模型,用于从点云数据中实现高精度的3D物体检测与定位。Patch Refinement由两个独立训练的基于VoxelNet的网络构成:区域提议网络(Region Proposal Network, RPN)和局部精修网络(Local Refinement Network, LRN)。该方法将检测任务分解为两个步骤:首先进行初步的鸟瞰图(Bird's Eye View, BEV)检测,随后执行局部3D检测。基于RPN生成的BEV候选位置,我们提取出小范围的点云子集(称为“补丁”,patches),并将其输入LRN进行处理。由于每个补丁所覆盖的区域较小,LRN在内存使用上受到的限制显著降低,因此可采用更高分辨率的体素(voxel)编码策略进行局部建模。此外,LRN的独立性使其能够灵活应用额外的数据增强技术,并支持高效、以回归为导向的训练策略——因其仅需利用场景中的极小部分数据。在KITTI 3D物体检测基准测试中,我们于2019年1月28日提交的方案,在汽车类别所有三种难度等级下均超越了此前所有提交结果。该成绩仅使用了50%的可用训练数据,且仅依赖激光雷达(LiDAR)信息。