2 个月前
移动设备上的实时立体图像深度估计
Yan Wang; Zihang Lai; Gao Huang; Brian H. Wang; Laurens van der Maaten; Mark Campbell; Kilian Q. Weinberger

摘要
在机器人领域的许多立体深度估计应用中,需要在显著的计算限制下实时生成精确的视差图。目前最先进的算法迫使人们在生成高精度但速度较慢的地图和快速生成低精度的地图之间做出选择,此外,这些方法通常需要过多的参数才能在功耗或内存受限的设备上使用。鉴于这些不足,我们提出了一种新的适用于任意时间设置的视差预测方法。与以往的工作不同,我们的端到端学习方法可以在推理时权衡计算量和准确性。深度估计是在多个阶段进行的,在此过程中可以随时查询模型以输出其当前的最佳估计值。我们的最终模型能够在NVIDIA Jetson TX2模块上以10-35帧每秒(FPS)的速度处理1242×375分辨率的图像,且误差仅略有增加——使用的参数比最具竞争力的基线少两个数量级。源代码可在https://github.com/mileyan/AnyNet 获取。