7 个月前

卷积神经网络

机器视觉 3D

计算机视觉

Clément Godard; Oisin Mac Aodha; Gabriel J. Brostow

摘要

基于学习的方法在单幅图像深度估计任务中已经展现出非常有前景的结果。然而，大多数现有的方法将深度预测视为一个监督回归问题，因此需要大量的对应真实深度数据进行训练。仅在各种环境中记录高质量的深度数据就是一个具有挑战性的问题。本文中，我们超越了现有方法，用更容易获取的双目立体视频替换了训练过程中显式的深度数据。我们提出了一种新的训练目标，使我们的卷积神经网络能够在没有真实深度数据的情况下学习执行单幅图像深度估计。通过利用视极几何约束，我们通过图像重建损失来训练网络以生成视差图。我们发现，仅解决图像重建问题会导致质量较差的深度图。为了解决这一问题，我们提出了一种新的训练损失函数，该函数强制左右图像之间产生的视差具有一致性，从而相比现有方法提高了性能和鲁棒性。我们的方法在KITTI驾驶数据集上产生了单目深度估计的最先进结果，甚至超过了使用真实深度数据进行训练的监督方法。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

卷积神经网络

机器视觉 3D

计算机视觉

Clément Godard; Oisin Mac Aodha; Gabriel J. Brostow

摘要

基于学习的方法在单幅图像深度估计任务中已经展现出非常有前景的结果。然而，大多数现有的方法将深度预测视为一个监督回归问题，因此需要大量的对应真实深度数据进行训练。仅在各种环境中记录高质量的深度数据就是一个具有挑战性的问题。本文中，我们超越了现有方法，用更容易获取的双目立体视频替换了训练过程中显式的深度数据。我们提出了一种新的训练目标，使我们的卷积神经网络能够在没有真实深度数据的情况下学习执行单幅图像深度估计。通过利用视极几何约束，我们通过图像重建损失来训练网络以生成视差图。我们发现，仅解决图像重建问题会导致质量较差的深度图。为了解决这一问题，我们提出了一种新的训练损失函数，该函数强制左右图像之间产生的视差具有一致性，从而相比现有方法提高了性能和鲁棒性。我们的方法在KITTI驾驶数据集上产生了单目深度估计的最先进结果，甚至超过了使用真实深度数据进行训练的监督方法。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供