17日前

AdaBins:適応的バインを用いた深度推定

Shariq Farooq Bhat, Ibraheem Alhashim, Peter Wonka
AdaBins:適応的バインを用いた深度推定
要約

単一のRGB入力画像から高品質な密集深度マップを推定する問題に取り組む。本研究では、ベースラインとしてエンコーダ・デコーダ型の畳み込みニューラルネットワークアーキテクチャを採用し、情報のグローバルな処理が全体的な深度推定性能にどのように寄与するかという問いを提示する。そのために、深度範囲を複数のビン(bin)に分割し、各画像ごとにビンの中心値を適応的に推定するトランスフォーマーに基づくアーキテクチャブロックを提案する。最終的な深度値は、これらのビン中心値の線形結合として推定される。本研究で提案する新たな構成要素を「AdaBins」と命名する。実験結果により、複数の代表的な深度データセットにおいて、すべての評価指標で従来の最先端手法を大きく上回ることが示された。さらに、アブレーションスタディを通じて提案ブロックの有効性を検証し、新しく達成した最先端モデルのコードおよび事前学習済み重みを公開する。

AdaBins:適応的バインを用いた深度推定 | 最新論文 | HyperAI超神経