2 个月前

MVSNet:无结构多视图立体深度推断

Yao Yao; Zixin Luo; Shiwei Li; Tian Fang; Long Quan
MVSNet:无结构多视图立体深度推断
摘要

我们提出了一种从多视角图像中推断深度图的端到端深度学习架构。在网络中,我们首先提取深层视觉图像特征,然后通过可微同胚变换在参考相机视锥体上构建3D代价体积。接下来,我们应用3D卷积来正则化和回归初始深度图,该深度图随后通过参考图像进行细化以生成最终输出。我们的框架能够灵活适应任意N视角输入,使用基于方差的成本度量方法将多个特征映射为一个成本特征。所提出的MVSNet在大规模室内DTU数据集上进行了验证。经过简单的后处理,我们的方法不仅显著优于以往的最先进方法,而且运行速度也快数倍。我们还在复杂的室外Tanks and Temples数据集上评估了MVSNet,在2018年4月18日之前未进行任何微调的情况下,我们的方法排名第一,展示了MVSNet的强大泛化能力。

MVSNet:无结构多视图立体深度推断 | 最新论文 | HyperAI超神经