2ヶ月前
異なる追跡タスクは異なる外観モデルを必要とするのか?
Zhongdao Wang; Hengshuang Zhao; Ya-Li Li; Shengjin Wang; Philip H.S. Torr; Luca Bertinetto

要約
動画中の関心対象の追跡は、コンピュータビジョンにおける最も人気があり、広く応用されている問題の一つです。しかし、年を経るにつれて、ユースケースとベンチマークのカムブリア爆発により、この問題は多くの異なる実験設定に分断されました。その結果、文献も分断され、コミュニティが提案する新しいアプローチは通常、特定の設定にのみ特化されています。この特化がどの程度必要であるかを理解するために、本研究では UniTrack を提示します。UniTrack は、監督学習または自己教師なし学習で学習できる単一かつタスク非依存の外観モデルと、個々のタスクに対処する複数の「ヘッド」(heads)から構成されています。これらの「ヘッド」は訓練を必要としません。私たちは、このフレームワーク内でほとんどの追跡タスクが解決できることを示し、同じ外観モデルを使用して専門的な方法と競合できる結果を得られることを確認しました。また、このフレームワークにより、最新の自己教師なし手法で得られた外観モデルを分析することが可能となりました。これにより、より多様な重要な問題に対する評価と比較が拡張されます。