2ヶ月前

単一のRGB画像から微細深度マップを推定するための2ストリームネットワーク

Jun Li; Reinhard Klein; Angela Yao
単一のRGB画像から微細深度マップを推定するための2ストリームネットワーク
要約

単一のRGB画像から深さを推定することは、不適切で本質的に曖昧な問題である。最先端の深層学習手法は現在、正確な2D深さマップを推定できるが、これらのマップを3Dに投影すると、局所的な詳細が欠け、しばしば大きく歪む。本研究では、高速に訓練可能な2ストリームCNNを提案し、深さと深さ勾配を予測し、これらを融合して正確かつ詳細な深さマップを作成する。また、複数の画像に対して新しい集合損失関数を定義した。共通の画像セット間での推定値の正則化により、ネットワークは過学習しにくく、競合する手法よりも高い精度を達成する。NYU Depth v2データセットにおける実験結果は、我々の深さ推定が最先端技術と同等であり、忠実な3D投影につながることを示している。(注:「set loss」は一般的には「集合損失」と訳されることが多いですが、「集合損失関数」の方がより具体的で理解しやすいため採用しました。)

単一のRGB画像から微細深度マップを推定するための2ストリームネットワーク | 最新論文 | HyperAI超神経