ハイブリッド-SORT:オンライン多対象追跡における弱い手がかりの重要性

多対象追跡(Multi-Object Tracking: MOT)は、フレーム間ですべての対象を検出および関連付けることを目的としている。多くの既存手法は、空間情報や外観情報といった強力な特徴量(強 cue)を明示的または暗黙的に活用することでこのタスクを達成しているが、これらは個体レベルでの強力な識別能力を発揮する。しかしながら、対象の遮蔽(occlusion)や密集(clustering)が発生する状況では、対象間の重なりが大きくなるため、空間情報および外観情報が同時に曖昧になってしまうという長年の課題が生じる。本論文では、この課題を、強 cue を補完するための弱い特徴量(weak cue)を導入することで、効率的かつ効果的に解決できることを示す。速度方向に加えて、信頼度(confidence)および高さ(height)の状態を新たな潜在的な弱 cue として提案する。本手法は、高い性能を維持しつつも、シンプルかつオンラインでリアルタイム処理が可能な SORT(Simple, Online and Real-Time)の特徴を保っている。さらに、学習不要かつプラグアンドプレイの形で、さまざまな追跡器およびシナリオに対して優れた汎化性能を示す。5つの代表的な追跡器に本手法を適用した結果、一貫して顕著な性能向上が観察された。特に、複雑な運動が頻発し、相互作用や重度の遮蔽がしばしば発生する DanceTrack データセットにおいて、強 cue と弱 cue を併用した本手法 Hybrid-SORT は、MOT17、MOT20 およびその他の多様なベンチマークにおいて優れた性能を達成した。コードおよびモデルは、https://github.com/ymzis69/HybridSORT にて公開されている。