
要約
形状マッチングを畳み込みネットワークを使用した計量学習として定式化しました。画像表現のエンドツーエンドのプロセスを2つの部分に分けています。まず、確立された効率的な手法を選択し、画像をエッジマップに変換します。次に、構造から運動(Structure-from-Motion)パイプラインによって自動的に取得されたランドマーク画像のエッジマップを使用してネットワークを訓練します。学習された表現は、さまざまなタスクで評価され、ドメイン一般化の困難なケースや一般的なスケッチベースの画像検索やその細かい対応において改善が見られました。他の方法がタスクごと、オブジェクトカテゴリごと、またはドメインごとに異なるモデルを学習するのに対し、我々はすべての実験で同じネットワークを使用しており、複数のベンチマークで最先端の結果を達成しています。