
要約
最新の光学フロー手法において、フルモーションコストボリュームは中心的な役割を果たしている。しかし、単純な特徴相関に基づいて構築されるため、事前知識や非局所的な知識を十分に捉える能力に欠ける。その結果、遮蔽領域やテクスチャが乏しい領域など、制約が弱く曖昧な領域にアーティファクトが生じる。本研究では、相関コストボリュームの即時置換可能な分離型コストボリュームモジュールを提案する。このモジュールは非局所集約層を用いて、グローバルな文脈情報や事前知識を活用し、こうした領域における運動の曖昧性を解消することを目的としている。実験結果から、本手法は標準的なSintelおよびKITTI光学フローベンチマークにおいて、精度面で既存の最先端手法を上回ることが示された。さらに、合成データから実データへの汎化性能が優れていることも確認された。