Command Palette

Search for a command to run...

4ヶ月前

EPP-MVSNet:エピポーラアセンブリングに基づくマルチビュー立体深度推定

{Fan Yu Lei Chen Jingwei Huang Qirui Wang Yue Gong Xinjun Ma}

EPP-MVSNet:エピポーラアセンブリングに基づくマルチビュー立体深度推定

要約

本稿では、マルチビューステレオ(MVS)からの3D再構成を目的とした新しい深層学習ネットワーク、EPP-MVSNetを提案する。EPP-MVSNetは、限定的なコストボリュームと最適な深度範囲において高解像度での特徴量を正確に集約できるため、効果的かつ効率的な3D構築を実現する。既存の手法が離散的な位置で特徴量コストを測定するため3D再構成精度に影響を及ぼすのに対し、EPP-MVSNetはエピポーラ線に沿った適応的間隔で動作するエピポーラアセンブリベースのカーネルを導入し、画像解像度を最大限に活用する。さらに、冗長性を最小限に抑えた空間幾何構造をコストボリュームで表現するため、エントロピーに基づく精緻化戦略を提案する。また、Pseudo-3D畳み込みを統合した軽量なネットワーク構造を設計することで、高い精度と効率性を両立した。本手法は、難易度の高いデータセットTanks & Temples(TNT)、ETH3DおよびDTUにおいて広範な実験を実施し、すべてのデータセットで有望な結果を達成した。特に、オンラインTNT中間ベンチマークでは最高のFスコアを記録した。コードは以下のURLで公開されている:https://gitee.com/mindspore/mindspore/tree/master/model_zoo/research/cv/eppmvsnet

ベンチマーク

ベンチマーク方法論指標
3d-reconstruction-on-dtuEPP-MVSNet
Acc: 0.413
Comp: 0.296
Overall: 0.355
point-clouds-on-tanks-and-templesEPP-MVSNet
Mean F1 (Advanced): 35.72
Mean F1 (Intermediate): 61.68

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
EPP-MVSNet:エピポーラアセンブリングに基づくマルチビュー立体深度推定 | 論文 | HyperAI超神経