HyperAI超神经
12 days ago

π^3: 可扩展的置换等变视觉几何学习

Yifan Wang, Jianjun Zhou, Haoyi Zhu, Wenzheng Chang, Yang Zhou, Zizun Li, Junyi Chen, Jiangmiao Pang, Chunhua Shen, Tong He
π^3: 可扩展的置换等变视觉几何学习
摘要

我们介绍了一种名为pi³的前馈神经网络,该网络提供了一种新颖的视觉几何重建方法,打破了对传统固定参考视图的依赖。以往的方法通常将其重建结果锚定在一个指定的视点上,这种归纳偏见可能导致在参考视图选择不佳时出现不稳定性和失败。相比之下,pi³采用了完全置换等变架构来预测仿射不变相机姿态和尺度不变局部点云图,无需任何参考帧。这一设计使得我们的模型对输入顺序具有内在鲁棒性,并且具有很高的可扩展性。这些优势使我们简单且无偏见的方法在包括相机姿态估计、单目/视频深度估计和密集点云图重建在内的广泛任务中实现了最先进的性能。代码和模型已公开可用。