
要約
監督された深さ推定は、高度な深層ネットワークアーキテクチャのおかげで高い精度を達成しています。しかし、真の深さラベル(groundtruth depth labels)を取得することは困難であるため、最近の手法では非監督的な手がかり(unsupervised cues)を探求して深度推定ネットワークを非監督的に学習しようと試みています。これらの方法は効果的ですが、真のラベルよりも信頼性が低いという問題があります。このジレンマを解決する新興的手法として、ドメイン適応技術を通じて真の深さを持つ合成画像から知識を転送することが挙げられます。しかしながら、これらのアプローチは目標ドメイン(つまり実際のデータ)における自然画像の特定の幾何学的構造を無視しており、これは高性能な深さ予測において重要な要素です。このような観察に基づいて、我々は合成データのラベルと実際のデータにおける基本線幾何学(epipolar geometry)を共同で探求する幾何学認識対称ドメイン適応フレームワーク(Geometry-Aware Symmetric Domain Adaptation, GASDA)を提案します。さらに、エンドツーエンドネットワーク内で2つの画像スタイル翻訳器と深さ推定器を対称的に訓練することで、当モデルはより優れた画像スタイル転送を達成し、高品質な深さマップを生成します。実験結果は我々が提案した手法の有効性を示し、最先端技術と同等以上の性能であることを確認しています。コードは公開され、以下のURLからアクセスできます: https://github.com/sshan-zhao/GASDA.