
要約
最近の自己監督モノocular深度推定技術は、教師あり手法に近い性能を達成しつつありますが、低解像度でのみ動作します。本研究では、高解像度が高精度な自己監督モノocular深度予測において重要な役割を果たすことを示しています。最近のSingle-Image Super-Resolution(単一画像超解像)の深層学習手法に着想を得て、深度超解像のためにサブピクセル畳み込み層の拡張を提案します。この手法は、対応する低解像度の畳み込み特徴量から正確に高解像度の視差を合成します。さらに、異なる左右の影領域が視差マップで生成される問題(遮蔽による)を軽減するために、画像とその水平反転版からの予測を正確に融合する微分可能なフリップ拡張層を導入しました。これらの貢献により、公開されているKITTIベンチマークにおける自己監督深度および姿勢推定の最先端技術に対して大幅な性能向上が得られました。当方針に関するビデオは以下のURLでご覧いただけます: https://youtu.be/jKNgBeBMx0I。