11日前

ACDNet:単眼パノラマ深度推定のための適応的結合拡張畳み込み

Chuanqing Zhuang, Zhengda Lu, Yiqun Wang, Jun Xiao, Ying Wang
ACDNet:単眼パノラマ深度推定のための適応的結合拡張畳み込み
要約

近年、パノラマ画像を用いた3D再構成において、深度推定は重要なステップとなっている。パノラマ画像は完全な空間情報を保持する一方で、等距離円筒投影(equirectangular projection)により歪みを生じる。本論文では、適応的結合拡張畳み込み(adaptively combined dilated convolution)を基盤としたACDNetを提案し、単眼パノラマ画像に対して高密度な深度マップを予測する。具体的には、異なる拡張率を持つ畳み込みカーネルを組み合わせることで、等距離円筒投影における受容野を拡張する。同時に、チャネルごとの特徴マップを統合するための適応的チャネルワイズ融合モジュールを導入し、受容野内における多様な注目領域を獲得する。このモジュールではチャネルワイズな注目機構を活用することで、チャネル間の文脈情報を効率的に捉え、活用することが可能となる。最終的に、3つのデータセット(仮想と現実世界の両方)を用いた深度推定実験を行い、実験結果から本提案するACDNetが現在の最先端(SOTA)手法を顕著に上回ることを示した。本研究のコードおよびモデルパラメータは、https://github.com/zcq15/ACDNet にて公開されている。

ACDNet:単眼パノラマ深度推定のための適応的結合拡張畳み込み | 最新論文 | HyperAI超神経