Suivi sans fioritures

Le problème de la traque de plusieurs objets dans une séquence vidéo présente plusieurs tâches complexes. Pour la traque par détection, celles-ci incluent la ré-identification des objets, la prédiction du mouvement et la gestion des occultations. Nous présentons un traceur (sans fioritures) qui réalise la traque sans cibler spécifiquement l'une de ces tâches, en particulier, nous ne réalisons aucune formation ou optimisation sur les données de traque. À cette fin, nous exploitons la régression des boîtes englobantes d'un détecteur d'objets pour prédire la position d'un objet dans le cadre suivant, transformant ainsi un détecteur en Tracktor. Nous démontrons le potentiel de Tracktor et fournissons un nouveau niveau d'excellence sur trois benchmarks de traque multi-objets en l'étendant avec une ré-identification simple et une compensation du mouvement de caméra. Nous effectuons ensuite une analyse des performances et des cas d'échec de plusieurs méthodes de traque à l'état de l'art en comparaison avec notre Tracktor. Surprenamment, aucune des méthodes dédiées à la traque n'est considérablement meilleure pour gérer des scénarios de traque complexes, notamment les objets petits et occultés ou les détections manquantes. Cependant, notre approche aborde efficacement la plupart des scénarios de traque simples. Par conséquent, nous motivons notre approche comme un nouveau paradigme de traque et soulignons les orientations prometteuses pour les futures recherches. Dans l'ensemble, Tracktor offre des performances supérieures à toute méthode actuelle de traque, et notre analyse met en lumière les défis restants et non résolus en matière de traque pour inspirer les futures orientations de recherche.