2 个月前

LED2-Net:通过可微分深度渲染实现单目360布局估计

Wang, Fu-En ; Yeh, Yu-Hsuan ; Sun, Min ; Chiu, Wei-Chen ; Tsai, Yi-Hsuan
LED2-Net:通过可微分深度渲染实现单目360布局估计
摘要

尽管在房间布局估计方面已经取得了显著进展,但大多数方法主要致力于减少二维像素坐标中的损失,而不是充分利用三维空间中的房间结构。为了在三维空间中重建房间布局,我们将360度布局估计任务定义为预测全景图地平线上的深度问题。具体而言,我们提出了可微深度渲染(Differentiable Depth Rendering)过程,使得从布局到深度预测的转换变得可微分,从而使我们提出的模型能够在利用三维几何信息的同时实现端到端训练,而无需提供真实深度数据。我们的方法在多个360度布局基准数据集上达到了最先进的性能。此外,我们的公式化方法允许在深度数据集上进行预训练步骤,这进一步提高了我们布局估计模型的泛化能力。