18日前

高解像度マルチスケール RAFT(Robust Vision Challenge 2022)

Azin Jahedi, Maximilian Luz, Lukas Mehl, Marc Rivinius, Andrés Bruhn
高解像度マルチスケール RAFT(Robust Vision Challenge 2022)
要約

本報告では、2022年ロバストビジョンチャレンジ(Robust Vision Challenge 2022)で優勝を果たした光学フロー手法、MS-RAFT+ を紹介する。本手法は、マルチスケールの概念を単一スケールのRAFTに効果的に統合したMS-RAFTに基づいている。我々のアプローチは、オンデマンドでのコスト計算を活用することで、より細かいスケールを追加的に用いることで、流れの推定精度を向上させた。このアーキテクチャにより、元の解像度の半分で処理が可能となるだけでなく、MS-RAFTが採用する共有凸上昇器(shared convex upsampler)を活用して、フル解像度の光学フローを取得できる。さらに、訓練段階において調整されたファインチューニングスキームを用いることで、複数ベンチマーク間での汎化性能を向上させることを目的としている。ロバストビジョンチャレンジに参加した全手法の中でも、VIPERでは1位、KITTI、Sintel、Middleburyでは2位を獲得し、全体ランキングで1位を獲得した。