
摘要
本文探讨了从单张静态图像中进行深度估计的问题。受近期多尺度卷积神经网络(CNN)研究的启发,我们提出了一种深度模型,该模型融合了来自多个CNN侧输出的互补信息。与以往方法不同的是,本研究通过连续条件随机场(CRFs)实现了信息的整合。具体而言,我们提出了两种不同的变体:一种基于多个CRFs的级联,另一种则基于统一的图模型。通过设计一种新颖的连续CRFs的CNN均值场更新实现方法,我们证明了所提出的两种模型均可被视为顺序深度网络,并且可以进行端到端训练。通过广泛的实验评估,我们展示了该方法的有效性,并在公开数据集上建立了新的最先进结果。