SparseTrack : Suivi d'objets multiples par décomposition de scène basée sur une pseudo-profondeur

L’exploration de méthodes d’association robustes et efficaces constitue toujours une question fondamentale dans le suivi multi-objets (MOT). Bien que les méthodes de suivi existantes aient atteint des performances impressionnantes, la congestion et les occlusions fréquentes continuent de poser des défis majeurs dans le suivi multi-objets. Nous démontrons que la décomposition creuse des scènes denses représente une étape cruciale pour améliorer la performance de l’association des objets occlus. À cette fin, nous proposons une méthode d’estimation de pseudo-profondeur permettant d’obtenir la profondeur relative des objets à partir d’images 2D. Ensuite, nous concevons un algorithme de correspondance en cascade de profondeur (DCM), qui utilise l’information de profondeur obtenue pour transformer un ensemble dense d’objets en plusieurs sous-ensembles d’objets creux, puis effectue l’association de données sur ces sous-ensembles creux dans l’ordre croissant de proximité. En intégrant la méthode de pseudo-profondeur et la stratégie DCM dans le processus d’association de données, nous proposons un nouveau suiveur, nommé SparseTrack. SparseTrack offre une nouvelle perspective pour résoudre le problème difficile du suivi multi-objets dans des scènes surpeuplées. En n’utilisant que le matching basé sur l’IoU, SparseTrack atteint une performance comparable aux méthodes de pointe (SOTA) sur les benchmarks MOT17 et MOT20. Le code et les modèles sont disponibles publiquement à l’adresse \url{https://github.com/hustvl/SparseTrack}.