11日前

動画からの教師なしスケール一貫性を持つ深度学習

Jia-Wang Bian, Huangying Zhan, Naiyan Wang, Zhichao Li, Le Zhang, Chunhua Shen, Ming-Ming Cheng, Ian Reid
動画からの教師なしスケール一貫性を持つ深度学習
要約

本稿では、学習にラベルなし動画のみを必要とし、推論時にスケール一貫性のある深度推定を実現する単眼深度推定器SC-Depthを提案する。本研究の主な貢献は以下の通りである:(i) 隣接視点間の予測深度の不整合をペナルティとして課す幾何学的整合性損失を提案した;(ii) 動的物体を自動的に検出する自己発見マスクを設計し、静的シーンの仮定に反する動きを特定することで、学習中のノイズ信号を低減した;(iii) 詳細なアブレーションスタディを通じて各構成要素の有効性を実証し、KITTIおよびNYUv2データセットにおいて高品質な深度推定結果を示した。さらに、スケール一貫性推定の能力を活かし、単眼学習済みの深層ネットワークがORB-SLAM2システムに容易に統合可能であることを示した。これにより、ハイブリッドな疑似RGBD SLAM手法がKITTIデータセットで優れた性能を発揮し、追加学習なしにKAISTデータセットにも良好な汎化性能を示した。最後に、定性的評価のための複数のデモを提供する。

動画からの教師なしスケール一貫性を持つ深度学習 | 最新論文 | HyperAI超神経