MotionTrack : Apprentissage d’un prédicteur de mouvement pour le suivi d’objets multiples

Des progrès significatifs ont été réalisés dans le suivi d’objets multiples (MOT) grâce à l’évolution des techniques de détection et d’identification réciproque (ReID). Malgré ces avancées, le suivi précis des objets dans des scénarios présentant une apparence homogène et un mouvement hétérogène reste un défi. Ce défi provient de deux facteurs principaux : une discriminabilité insuffisante des caractéristiques ReID et l’utilisation prédominante de modèles de mouvement linéaires dans les approches de MOT. Dans ce contexte, nous introduisons un nouveau suiveur basé sur le mouvement, appelé MotionTrack, centré sur un prédicteur de mouvement apprenable qui ne repose que sur les informations de trajectoire des objets. Ce prédicteur intègre de manière exhaustive deux niveaux de granularité des caractéristiques de mouvement afin d’améliorer la modélisation des dynamiques temporelles et de faciliter une prédiction précise du mouvement futur pour chaque objet. Plus précisément, l’approche proposée utilise un mécanisme d’attention auto-attentive pour capturer les informations au niveau des tokens et une couche MLP dynamique pour modéliser les caractéristiques au niveau des canaux. MotionTrack est une méthode simple et en ligne de suivi. Nos résultats expérimentaux démontrent que MotionTrack atteint des performances de pointe sur des jeux de données tels que Dancetrack et SportsMOT, caractérisés par des mouvements d’objets extrêmement complexes.