7ヶ月前

3D マシンビジョン

ビデオ理解

コンピュータビジョン

Yifan Wang Jianjun Zhou Haoyi Zhu Wenzheng Chang Yang Zhou Zizun Li Junyi Chen Jiangmiao Pang Chunhua Shen Tong He

概要

私たちはpi^3（パイキューブ）、視覚幾何学再構築に新たなアプローチを提供するフィードフォワードニューラルネットワークを紹介します。従来の方法では、指定された視点に再構築を固定することが一般的で、この帰納的バイアスは参照が最適でない場合に不安定性や失敗につながることがあります。対照的に、pi^3は完全に置換等変なアーキテクチャを採用し、参照フレームなしでアフィン不変カメラポーズとスケール不変局所ポイントマップを予測します。この設計により、モデルは入力順序に対して本質的に堅牢であり、大規模化にも優れています。これらの利点により、私たちの単純かつバイアスのない手法は、カメラポーズ推定、単眼/ビデオ深度推定、および稠密ポイントマップ再構築など幅広いタスクにおいて最先端の性能を達成しています。コードとモデルは公開されています。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

7ヶ月前

3D マシンビジョン

ビデオ理解

コンピュータビジョン

Yifan Wang Jianjun Zhou Haoyi Zhu Wenzheng Chang Yang Zhou Zizun Li Junyi Chen Jiangmiao Pang Chunhua Shen Tong He

概要

私たちはpi^3（パイキューブ）、視覚幾何学再構築に新たなアプローチを提供するフィードフォワードニューラルネットワークを紹介します。従来の方法では、指定された視点に再構築を固定することが一般的で、この帰納的バイアスは参照が最適でない場合に不安定性や失敗につながることがあります。対照的に、pi^3は完全に置換等変なアーキテクチャを採用し、参照フレームなしでアフィン不変カメラポーズとスケール不変局所ポイントマップを予測します。この設計により、モデルは入力順序に対して本質的に堅牢であり、大規模化にも優れています。これらの利点により、私たちの単純かつバイアスのない手法は、カメラポーズ推定、単眼/ビデオ深度推定、および稠密ポイントマップ再構築など幅広いタスクにおいて最先端の性能を達成しています。コードとモデルは公開されています。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています