2ヶ月前
多スケール連続CRFsを用いた単眼深度推定の逐次深層ネットワーク
Dan Xu; Elisa Ricci; Wanli Ouyang; Xiaogang Wang; Nicu Sebe

要約
本論文は、単一の静止画像からの深度推定問題に取り組んでいます。最近の多尺度畳み込みニューラルネットワーク(CNN)に関する研究から着想を得て、複数のCNN側出力から得られる補完的な情報を融合する深層モデルを提案します。従来の手法とは異なり、この情報統合は連続条件随伴確率場(Continuous Conditional Random Fields: CRFs)を用いて達成されます。特に、我々は2つの異なる変種を提案しています。1つは複数のCRFsをカスケード接続したモデル、もう1つは統一されたグラフィカルモデルです。連続CRFsの平均場更新を新しいCNN実装で設計することにより、両方の提案モデルが逐次的な深層ネットワークとしてみなされ、エンドツーエンドでの学習が可能であることを示しています。広範な実験評価を通じて、提案手法の有効性を証明し、公開データセット上で新たな最先端の結果を達成しました。