Command Palette
Search for a command to run...
動画からの深度および自己運動の教師なし学習
動画からの深度および自己運動の教師なし学習
Zhou Tinghui Brown Matthew Snavely Noah Lowe David G.
概要
本稿では、構造化されていない動画シーケンスから単眼深度およびカメラの運動推定を行うための非教師あり学習フレームワークを提案する。本手法では、視点合成(view synthesis)を教師信号として用いることで、深度推定ネットワークとカメラポーズ推定ネットワークを同時に学習する。学習過程では、これらのネットワークが視点合成の目的関数によって結合されるが、テスト時にはそれぞれ独立して適用可能である。KITTIデータセットを用いた実証的な評価により、本手法の有効性が示された。具体的には、1) 地面真値のポーズまたは深度を用いて学習する教師あり手法と同等の単眼深度推定性能を達成し、2) 同等の入力条件下で既存のSLAMシステムと比較して、カメラポーズ推定性能において優れた結果を示した。