7 个月前

摘要

单目深度估计在理解三维场景几何中起着至关重要的作用，但这是一个病态问题。近期的方法通过探索图像级信息和来自深度卷积神经网络（DCNNs）的层次特征，取得了显著的改进。这些方法将深度估计建模为回归问题，并通过最小化均方误差来训练回归网络，但这导致了收敛速度慢和局部解不满意的问题。此外，现有的深度估计网络采用了重复的空间池化操作，从而产生了不理想的低分辨率特征图。为了获得高分辨率的深度图，需要使用跳跃连接或多层次反卷积网络，这不仅增加了网络训练的复杂性，还消耗了更多的计算资源。为了消除或至少大幅减少这些问题，我们引入了一种间距递增离散化（SID）策略来对深度进行离散化，并将深度网络学习重新定义为顺序回归问题。通过使用顺序回归损失函数训练网络，我们的方法实现了更高的精度和更快的同步收敛速度。此外，我们采用了一种多尺度网络结构，避免了不必要的空间池化，并并行捕获多尺度信息。本文所述的方法在四个具有挑战性的基准数据集上取得了最先进的结果，即 KITTI [17]、ScanNet [9]、Make3D [50] 和 NYU Depth v2 [42]，并在 2018 年鲁棒视觉挑战赛中荣获第一名。代码已公开发布于：https://github.com/hufu6371/DORN。

源 PDF