16日前

UniFuse:360°パノラマ深度推定のための単方向融合

Hualie Jiang, Zhe Sheng, Siyu Zhu, Zilong Dong, Rui Huang
UniFuse:360°パノラマ深度推定のための単方向融合
要約

球面パノラマから深度を学習することは、環境の全視野(FOV)を有し、シーンを比較的完全に表現できるため、近年注目される研究テーマとなっている。しかし、従来の透視画像に適用されてきた精度の高いCNNを、球面パノラマの標準的な表現形式である等距離円柱投影(equirectangular projection)に直接適用する場合、極付近で歪みが生じるという問題がある。一方、歪みのない立方体マップ投影(cubemap projection)は、エッジで不連続性を示し、視野も限定されるという課題を抱えている。本論文では、これらの二つの投影形式から得られる特徴量を融合する新しいフレームワークを提案する。本手法は、エンコーディング段階では等距離円柱投影の特徴量を用い、デコーディング段階でのみ立方体マップの特徴量を単方向的に伝達する方式を採用している。最近の双方向融合アプローチがエンコーディングとデコーディングの両段階で特徴量を融合するのに対し、本手法は単方向の融合構造を採用することで、はるかに高い効率性を実現している。さらに、本融合スキームに適したより効果的な融合モジュールも新たに設計した。実験により、提案する融合戦略およびモジュールの有効性が検証され、4つの代表的なデータセットにおいて最先端(SOTA)の性能を達成した。追加の実験から、モデルの複雑さの低さと汎化能力の高さも示された。コードは以下のURLで公開されている:https://github.com/alibaba/UniFuse-Unidirectional-Fusion

UniFuse:360°パノラマ深度推定のための単方向融合 | 最新論文 | HyperAI超神経