2 个月前
单目3D物体检测的几何不确定性投影网络
Lu, Yan ; Ma, Xinzhu ; Yang, Lei ; Zhang, Tianzhu ; Liu, Yating ; Chu, Qi ; Yan, Junjie ; Ouyang, Wanli

摘要
几何投影是一种强大的单目3D物体检测深度估计方法。该方法通过高度来估计深度,从而将数学先验引入到深度模型中。然而,投影过程也会带来误差放大问题,即估计的高度误差会在输出的深度上被显著放大和反映出来。这一特性导致了深度推断的不可控性,并且损害了训练效率。在本文中,我们提出了一种几何不确定性投影网络(GUP Net),以解决在推理和训练阶段的误差放大问题。具体而言,设计了一个GUP模块来获取推断深度的几何引导不确定性,这不仅为每个深度提供了高可靠的置信度,还促进了深度学习的效果。此外,在训练阶段,我们提出了一种分层任务学习策略,以减少由误差放大引起的不稳定因素。该学习算法通过一个设计的指标来监控每个任务的学习情况,并根据其前置任务的学习状态自适应地分配不同的损失权重。基于此策略,每个任务仅在其前置任务学得较好时才开始学习,这可以显著提高训练过程的稳定性和效率。大量的实验验证了所提方法的有效性。整体模型能够比现有方法更可靠地推断出物体的深度,并在KITTI基准测试中,对于汽车和行人类别的AP40指标分别优于当前最先进的基于图像的单目3D检测器3.74%和4.7%。