
要約
本論文では、深層特徴の空間情報を分析し、堅牢な視覚追跡のための2つの補完的な回帰手法を提案します。まず、カーネル値が2つのサンプル間のすべてのパッチ対の類似度スコアの加重和として定義されるカーネル化リッジ回帰モデルを提案します。このモデルはニューラルネットワークとして表現できるため、効率的に解くことができます。次に、空間正則化カーネルを持つ完全畳み込みニューラルネットワークを提案します。これにより、各出力チャネルに対応するフィルターカーネルが目標の特定の領域に集中することが強制されます。さらに、距離変換プーリングを用いて畳み込み層の各出力チャネルの有効性を決定します。カーネル化リッジ回帰モデルと完全畳み込みニューラルネットワークからの出力を組み合わせることで最終的な応答を得ます。2つのベンチマークデータセットにおける実験結果は、提案手法の有効性を検証しています。