
要約
シアメス型の追跡器は、テンプレート領域と検索領域の特徴量間の類似性マッチングを用いて追跡を行う。特に、対象の外観変化(変形や遮蔽など)が生じる状況をより適切に扱うために、追跡履歴を組み込むことで追跡性能を向上させる手法が多数検討されている。しかし、従来の手法では履歴情報の活用が不十分かつ不完全であり、通常は繰り返しの再訓練を要し、計算量も大幅に増加するという問題がある。本論文では、シアメス型追跡器に正確かつ最新の履歴情報を提供することで、パラメータを一切変更せずに顕著な性能向上が達成可能であることを示す。これを基に、精密に精製された過去の前景マスクおよび対象の過去視覚特徴を用いて、追跡器に包括的かつ正確なプロンプトを供給する「履歴プロンプトネットワーク(Historical Prompt Network)」を提案する。このネットワークを基盤として、モデル全体の再訓練を必要とせずに顕著な性能向上を実現する新規追跡器「HIPTrack」を構築した。7つのデータセットにおける実験結果から、本手法はLaSOT、LaSOText、GOT-10k、NfSにおいて、現在の最先端追跡器を上回ることを示した。さらに、本履歴プロンプトネットワークは既存の追跡器に「プラグアンドプレイ」形式で容易に統合可能であり、性能向上を実現できる。実装コードは https://github.com/WenRuiCai/HIPTrack にて公開されている。