
要約
ホモグラフィー推定は、多くのコンピュータビジョンタスクにおいて不可欠なステップである。しかしながら、従来の手法は照明条件の変化および/または大規模な視点変化に対して十分なロバスト性を有していない。本論文では、教師なしホモグラフィー推定を目的として、双方向的暗黙的ホモグラフィー推定(biHomE)損失を提案する。biHomEは、元の視点から得られた画像を変形(ワープ)した結果と、対応するターゲット視点からの画像との間の特徴空間における距離を最小化する。本手法では、固定された事前学習済みの特徴抽出器を使用し、フレームワーク内で学習可能な唯一の要素はホモグラフィーネットワークであるため、ホモグラフィー推定と表現学習を効果的に分離できる。さらに、合成COCOデータセットの生成プロセスにおいて、実世界の照明変化をより適切に表現するため、追加の光度歪み(photometric distortion)ステップを導入している。実験結果から、biHomEは合成COCOデータセットにおいて最先端の性能を達成しており、教師あり手法と比較しても同等または優れた結果を示す。さらに、実証的な結果により、既存手法と比較して本手法の照明変化に対するロバスト性が明確に示された。