11 天前

NimbleD:通过伪标签与大规模视频预训练增强自监督单目深度估计

Albert Luginov, Muhammad Shahzad
NimbleD:通过伪标签与大规模视频预训练增强自监督单目深度估计
摘要

我们提出NimbleD,一种高效且自监督的单目深度估计学习框架,该框架利用大型视觉模型生成的伪标签提供监督信号。该框架无需相机内参,从而可在公开可用的视频数据上实现大规模预训练。我们提出的简单而有效的学习策略显著提升了快速轻量级模型的性能,且不引入额外计算开销,使其在性能上可媲美当前最先进的自监督单目深度估计模型。这一进展尤其适用于对低延迟推理有严格要求的虚拟现实与增强现实应用场景。项目源代码、模型权重及相关致谢信息已开源,详见:https://github.com/xapaxca/nimbled。

NimbleD:通过伪标签与大规模视频预训练增强自监督单目深度估计 | 最新论文 | HyperAI超神经