
要約
大規模なクラス内変動の下での視覚的対応関係の確立には、意味論やコンテクストに関連する特徴から局所パターンまで、異なるレベルで画像を分析し、個体固有の詳細に対して不変であることが必要です。これらの課題に対処するために、私たちは畳み込みニューラルネットワークの初期層から後期層にわたる少数の関連性のある特徴を選択して、「ハイパーピクセル」によって画像を表現します。ハイパーピクセルの凝縮された特徴を利用することで、Hough幾何学投票に基づく効果的なリアルタイムマッチングアルゴリズムを開発しました。提案した手法「ハイパーピクセルフロー」は、3つの標準ベンチマークおよび新しいデータセットSPair-71k(既存のデータセットよりも大幅に多くの画像ペアを含み、より正確で豊富な注釈が付いており、深層分析に適しています)において新たな最先端の成果を達成しています。