6 个月前

卷积神经网络

计算机视觉

计算机视觉

S. Mahdi H. Miangoleh Sebastian Dille Long Mai Sylvain Paris Yağız Aksoy

摘要

神经网络在从单张图像估计深度方面展现出强大能力。然而，其推断出的深度图分辨率通常低于一兆像素，且往往缺乏精细的细节，限制了实际应用价值。本文基于对输入图像分辨率与场景结构如何影响深度估计性能的分析，揭示了场景结构的一致性与高频细节之间存在权衡关系。为此，我们提出一种基于简单深度融合网络的方法，将低分辨率与高分辨率的估计结果进行融合，以充分利用这一双重特性。我们提出了双阶段估计方法，以提升全局深度估计的准确性；同时引入补丁选择策略，将局部细节有效注入最终结果。实验表明，通过在不同分辨率下结合变化的上下文信息进行估计融合，仅需使用预训练模型即可生成具有高度细节表现的多兆像素级深度图。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

卷积神经网络

计算机视觉

计算机视觉

S. Mahdi H. Miangoleh Sebastian Dille Long Mai Sylvain Paris Yağız Aksoy

摘要

神经网络在从单张图像估计深度方面展现出强大能力。然而，其推断出的深度图分辨率通常低于一兆像素，且往往缺乏精细的细节，限制了实际应用价值。本文基于对输入图像分辨率与场景结构如何影响深度估计性能的分析，揭示了场景结构的一致性与高频细节之间存在权衡关系。为此，我们提出一种基于简单深度融合网络的方法，将低分辨率与高分辨率的估计结果进行融合，以充分利用这一双重特性。我们提出了双阶段估计方法，以提升全局深度估计的准确性；同时引入补丁选择策略，将局部细节有效注入最终结果。实验表明，通过在不同分辨率下结合变化的上下文信息进行估计融合，仅需使用预训练模型即可生成具有高度细节表现的多兆像素级深度图。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供