16日前

EPP-MVSNet:エピポーラアセンブリングに基づくマルチビュー立体深度推定

{Fan Yu, Lei Chen, Jingwei Huang, Qirui Wang, Yue Gong, Xinjun Ma}
EPP-MVSNet:エピポーラアセンブリングに基づくマルチビュー立体深度推定
要約

本稿では、マルチビューステレオ(MVS)からの3D再構成を目的とした新しい深層学習ネットワーク、EPP-MVSNetを提案する。EPP-MVSNetは、限定的なコストボリュームと最適な深度範囲において高解像度での特徴量を正確に集約できるため、効果的かつ効率的な3D構築を実現する。既存の手法が離散的な位置で特徴量コストを測定するため3D再構成精度に影響を及ぼすのに対し、EPP-MVSNetはエピポーラ線に沿った適応的間隔で動作するエピポーラアセンブリベースのカーネルを導入し、画像解像度を最大限に活用する。さらに、冗長性を最小限に抑えた空間幾何構造をコストボリュームで表現するため、エントロピーに基づく精緻化戦略を提案する。また、Pseudo-3D畳み込みを統合した軽量なネットワーク構造を設計することで、高い精度と効率性を両立した。本手法は、難易度の高いデータセットTanks & Temples(TNT)、ETH3DおよびDTUにおいて広範な実験を実施し、すべてのデータセットで有望な結果を達成した。特に、オンラインTNT中間ベンチマークでは最高のFスコアを記録した。コードは以下のURLで公開されている:https://gitee.com/mindspore/mindspore/tree/master/model_zoo/research/cv/eppmvsnet。

EPP-MVSNet:エピポーラアセンブリングに基づくマルチビュー立体深度推定 | 最新論文 | HyperAI超神経