4ヶ月前

単一画像深度推定の再検討:高解像度マップと正確なオブジェクト境界に向けて

Junjie Hu; Mete Ozay; Yan Zhang; Takayuki Okatani
単一画像深度推定の再検討:高解像度マップと正確なオブジェクト境界に向けて
要約

本論文では、単一画像からの深度推定の問題について考察する。最近、畳み込みニューラルネットワーク(CNNs)の利用により、この問題に関する研究に大きな進展がもたらされた。しかし、既存の手法の多くは推定された深度マップでの空間解像度の低下に悩まされており、その典型的な症状として物体境界の歪曲やぼけが挙げられる。本論文では、より高い空間解像度を持つ深度マップを対象としたより正確な推定を目指し、既存手法に対する2つの改善点を提案する。1つ目は異なるスケールで抽出された特徴量を融合するための戦略に関するものであり、これに対して4つのモジュールから構成される改良型ネットワークアーキテクチャを提案する:エンコーダー、デコーダー、多スケール特徴量融合モジュール、および精製モジュール。2つ目は訓練時に使用される推論誤差の測定に用いられる損失関数に関するものである。我々は深度誤差、勾配誤差、表面法線誤差をそれぞれ測定する3つの損失項が互いに補完的な形で精度向上に寄与することを示す。実験結果は、これらの2つの改善点が現行の最先端技術よりも高い精度を達成できることを示しており、特に小物体や物体境界において細かい解像度再構成が可能となっている。

単一画像深度推定の再検討:高解像度マップと正確なオブジェクト境界に向けて | 論文 | HyperAI超神経