11日前
階層的正規化を用いたロバストなモノクロmaal深度推定
Chi Zhang, Wei Yin, Zhibin Wang, Gang Yu, Bin Fu, Chunhua Shen

要約
本稿では、深層ニューラルネットワークを用いた単眼深度推定について考察する。さまざまなデータセット源を活用した深層単眼推定モデルの学習を可能とするために、最先端の手法はアフィン不変な深度表現を生成するための画像レベルの正規化戦略を採用している。しかしながら、画像レベルの正規化に基づく学習は、画像全体の統計量、例えばシーンの構造といったピクセル表現間の関係に主眼を置く一方で、細粒度な深度差の情報が軽視されがちである。本稿では、空間情報および深度分布に基づいて階層的に深度表現を正規化する新しいマルチスケール深度正規化法を提案する。従来の全体画像レベルでのみ適用される正規化戦略と比較して、本手法は細粒度な詳細情報を効果的に保持でき、推定精度を向上させる。また、深度領域と空間領域のそれぞれにおいて、階層的正規化の文脈を定義する2つの戦略を提示する。広範な実験の結果、提案手法は従来の正規化手法を顕著に上回り、5つのゼロショット転移ベンチマークデータセットにおいて新たな最先端性能を達成した。