
要約
画像間の相対的なホモグラフィを推定するための深層畳み込みニューラルネットワークを提案します。当該前向きネットワークは10層から構成され、2つの重ね合わせたグレースケール画像を入力とし、最初の画像のピクセルを2つ目の画像にマッピングするために使用できる8自由度のホモグラフィを出力します。HomographyNet用に2つの畳み込みニューラルネットワークアーキテクチャを提示します:直接実数値のホモグラフィパラメータを推定する回帰ネットワークと、量子化されたホモグラフィ上の分布を生成する分類ネットワークです。4点ホモグラフィパラメータ化を使用しており、これは1つの画像から4つのコーナーを2つ目の画像にマッピングします。当社のネットワークは、歪められたMS-COCO画像を使用してエンドツーエンドで学習されます。当社の手法は、個別の局所特徴検出や変換推定ステージなしで動作します。深層モデルはORB特徴に基づく伝統的なホモグラフィ推定器と比較され、HomographyNetが伝統的な手法を超えるシナリオについて強調しています。また、深層学習によるホモグラフィ推定が可能にする様々な応用例についても説明し、深層学習アプローチの柔軟性を示しています。