HyperAIHyperAI

Command Palette

Search for a command to run...

ManyDepth2:动态场景中面向运动感知的自监督单目深度估计

Kaichen Zhou Jia-Wang Bian Jian-Qing Zheng Jiaxing Zhong Qian Xie Niki Trigoni Andrew Markham

摘要

尽管自监督单目深度估计技术取得了显著进展,但在动态场景下仍面临诸多挑战,主要源于对静态世界假设的依赖。本文提出 Manydepth2,旨在实现对动态物体与静态背景的高精度深度估计,同时保持良好的计算效率。为应对动态内容带来的挑战,我们引入光流与粗略单目深度信息,构建一个伪静态参考帧。该参考帧与原始目标帧协同,用于生成具备运动感知能力的代价体(motion-aware cost volume)。此外,为提升网络架构的准确性与鲁棒性,我们提出一种基于注意力机制的深度估计网络,通过融合通道注意力与非局部注意力机制,有效整合多尺度特征图中的信息。在与计算开销相近的方法对比中,Manydepth2 在 KITTI-2015 数据集上的自监督单目深度估计任务中,均方根误差(RMSE)显著降低了约 5%。代码已开源,地址为:https://github.com/kaichen-z/Manydepth2


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供