
摘要
近期的研究表明,从立体图像对中估计深度可以被表述为一个监督学习任务,并通过卷积神经网络(CNNs)来解决。然而,现有的架构依赖于基于补丁的孪生网络,缺乏在不明确区域利用上下文信息寻找对应关系的手段。为了解决这一问题,我们提出了一种金字塔立体匹配网络(PSMNet),该网络由两个主要模块组成:空间金字塔池化和3D CNN。空间金字塔池化模块通过在不同尺度和位置聚合上下文信息,利用全局上下文信息的能力来形成成本体积。3D CNN则通过堆叠多个沙漏网络并结合中间监督,学习如何正则化成本体积。所提出的算法已在多个基准数据集上进行了评估。在2018年3月18日之前,我们的方法在KITTI 2012和2015排行榜上均排名第一。PSMNet的代码可在以下地址获取:https://github.com/JiaRenChang/PSMNet。