Hybrid-SORT : Les indices faibles comptent pour le suivi en temps réel de plusieurs objets

Le suivi d’objets multiples (Multi-Object Tracking, MOT) vise à détecter et à associer tous les objets d’intérêt à travers les trames. La plupart des méthodes accomplissent cette tâche en exploitant explicitement ou implicitement des indices forts (tels que les informations spatiales et d’apparence), qui offrent une discrimination puissante au niveau des instances. Toutefois, en cas d’occlusion ou de regroupement d’objets, ces informations spatiales et d’apparence deviennent simultanément ambigües en raison de la forte superposition entre les objets. Dans cet article, nous démontrons qu’un défi ancien dans le domaine du MOT peut être résolu de manière efficace et robuste en intégrant des indices faibles afin de compenser les indices forts. En complément de la direction de vitesse, nous introduisons la confiance et l’état de hauteur comme des indices faibles potentiels. Grâce à des performances supérieures, notre méthode préserve néanmoins les caractéristiques de simplicité, d’opération en ligne et de temps réel (SORT). De plus, elle présente une excellente généralisation sur divers trackers et scénarios, de manière plug-and-play et sans nécessiter d’entraînement. Des améliorations significatives et cohérentes sont observées lors de l’application de notre méthode à cinq trackers représentatifs différents. Enfin, en combinant à la fois indices forts et faibles, notre méthode Hybrid-SORT atteint des performances supérieures sur diverses bases de données, notamment MOT17, MOT20, et particulièrement DanceTrack, où les interactions entre objets, les occlusions sévères et les mouvements complexes sont fréquents. Le code source et les modèles sont disponibles à l’adresse suivante : https://github.com/ymzis69/HybridSORT.