8 个月前

卷积神经网络

计算机视觉

Jia-Wang Bian Zhichao Li Naiyan Wang Huangying Zhan Chunhua Shen Ming-Ming Cheng Ian Reid

摘要

近期的研究表明，基于卷积神经网络（CNN）的深度估计器和自我运动估计器可以使用未标记的单目视频进行学习。然而，由于几何图像重建中假设场景静止不变，未识别的移动物体限制了这些方法的性能。更为重要的是，由于缺乏适当的约束条件，网络在不同样本上输出的结果存在尺度不一致性，即自我运动网络无法为长视频序列提供完整的相机轨迹，因为每一帧都存在尺度不确定性。本文通过提出一种几何一致性损失来实现尺度一致性的预测，并引入了一种自发现的掩码来处理移动物体和遮挡问题。由于我们没有采用多任务学习的方法，我们的框架更加简单且高效。全面的评估结果表明，我们的深度估计器在KITTI数据集上达到了最先进的性能。此外，我们展示了自我运动网络能够为长视频序列预测出全局尺度一致的相机轨迹，并且由此产生的视觉里程计精度与最近使用立体视频训练的模型相当。据我们所知，这是首次证明使用未标记单目视频训练的深度网络可以预测长视频序列中的全局尺度一致相机轨迹的工作。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

卷积神经网络

计算机视觉

Jia-Wang Bian Zhichao Li Naiyan Wang Huangying Zhan Chunhua Shen Ming-Ming Cheng Ian Reid

摘要

近期的研究表明，基于卷积神经网络（CNN）的深度估计器和自我运动估计器可以使用未标记的单目视频进行学习。然而，由于几何图像重建中假设场景静止不变，未识别的移动物体限制了这些方法的性能。更为重要的是，由于缺乏适当的约束条件，网络在不同样本上输出的结果存在尺度不一致性，即自我运动网络无法为长视频序列提供完整的相机轨迹，因为每一帧都存在尺度不确定性。本文通过提出一种几何一致性损失来实现尺度一致性的预测，并引入了一种自发现的掩码来处理移动物体和遮挡问题。由于我们没有采用多任务学习的方法，我们的框架更加简单且高效。全面的评估结果表明，我们的深度估计器在KITTI数据集上达到了最先进的性能。此外，我们展示了自我运动网络能够为长视频序列预测出全局尺度一致的相机轨迹，并且由此产生的视觉里程计精度与最近使用立体视频训练的模型相当。据我们所知，这是首次证明使用未标记单目视频训练的深度网络可以预测长视频序列中的全局尺度一致相机轨迹的工作。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供