16日前

DEFT:トラッキングのための検出埋め込み

Mohamed Chaabane, Peter Zhang, J. Ross Beveridge, Stephen O&#39, Hara
DEFT:トラッキングのための検出埋め込み
要約

現代の多数対象追跡(Multiple Object Tracking: MOT)システムの多くは、「検出による追跡(tracking-by-detection)」という枠組みに従っており、検出器の後に検出結果をトラックに連携する手法が続く。追跡分野では、遮蔽やその他の課題に対する耐性を高めるために、運動情報と外見特徴を組み合わせるアプローチが長年にわたり研究されてきたが、通常、その恩恵は実装の複雑化と処理速度の低下というトレードオフを伴う。近年、代表的な2次元追跡ベンチマークにおいて、最先端の検出器と単一フレームの空間オフセットに基づく比較的単純な連携手法を用いることで、高いスコアが達成されており、学習された外見特徴を活用して失われたトラックを再識別する従来の手法を上回る結果が得られている。本論文では、追跡用の外見特徴埋め込み(Detection Embeddings for Tracking: DEFT)を採用した効率的な同時検出・追跡モデルを提案する。本手法は、基礎となる物体検出ネットワークと jointly に学習される外見に基づく対象マッチングネットワークに依拠しており、さらにLSTMを用いて運動制約を捉える。DEFTは、2次元オンライン追跡のトップ・リーダーボードにおいて、最先端手法と同等の精度と速度を達成しつつ、より困難な追跡データに対して顕著な耐性の優位性を示す。また、nuScenes単眼3次元追跡チャレンジにおいては、従来の最良手法の性能を2倍以上に上回り、新たな基準を設定した。実装コードは公開されている。

DEFT:トラッキングのための検出埋め込み | 最新論文 | HyperAI超神経