Command Palette
Search for a command to run...
π^3: スケーラブルな置換等変視覚幾何学学習
π^3: スケーラブルな置換等変視覚幾何学学習
Yifan Wang Jianjun Zhou Haoyi Zhu Wenzheng Chang Yang Zhou Zizun Li Junyi Chen Jiangmiao Pang Chunhua Shen Tong He
概要
私たちはpi^3(パイキューブ)、視覚幾何学再構築に新たなアプローチを提供するフィードフォワードニューラルネットワークを紹介します。従来の方法では、指定された視点に再構築を固定することが一般的で、この帰納的バイアスは参照が最適でない場合に不安定性や失敗につながることがあります。対照的に、pi^3は完全に置換等変なアーキテクチャを採用し、参照フレームなしでアフィン不変カメラポーズとスケール不変局所ポイントマップを予測します。この設計により、モデルは入力順序に対して本質的に堅牢であり、大規模化にも優れています。これらの利点により、私たちの単純かつバイアスのない手法は、カメラポーズ推定、単眼/ビデオ深度推定、および稠密ポイントマップ再構築など幅広いタスクにおいて最先端の性能を達成しています。コードとモデルは公開されています。