Command Palette
Search for a command to run...
Une homographie suffit : estimation conjointe de l'homographie et des états d'objets multiples basée sur le modèle IMM
Une homographie suffit : estimation conjointe de l'homographie et des états d'objets multiples basée sur le modèle IMM
Paul Johannes Claasena Johan Pieter de Villiersa
Résumé
Un nouvel algorithme de suivi en ligne multi-object (MOT) nommé IMM Joint Homography State Estimation (IMM-JHSE) est proposé. L'IMM-JHSE utilise une estimation initiale d'homographie comme seule information 3D supplémentaire, tandis que les autres méthodes de MOT 3D utilisent des mesures 3D régulières. En modélisant conjointement la matrice d'homographie et sa dynamique comme partie des vecteurs d'état de suivi, l'IMM-JHSE élimine l'influence explicite des techniques de compensation du mouvement de la caméra sur les états prédits des trajectoires, ce qui était courant dans les approches précédentes. S'appuyant sur cela, des modèles de mouvement statique et dynamique de la caméra sont combinés à l'aide d'un filtre IMM. Un modèle simple de mouvement de boîtes englobantes est utilisé pour prédire les positions des boîtes englobantes afin d'intégrer les informations du plan image. Outre l'application d'un IMM au mouvement de la caméra, une approche non standard d'IMM est adoptée où les scores BIoU basés sur les boîtes englobantes sont mélangés avec les distances de Mahalanobis basées sur le plan du sol selon une méthode similaire à celle de l'IMM pour effectuer uniquement l'association, rendant ainsi l'IMM-JHSE robuste aux mouvements éloignés du plan du sol. Enfin, l'IMM-JHSE utilise des techniques d'estimation du bruit du processus et des mesures dynamiques. L'IMM-JHSE améliore les techniques connexes telles que UCMCTrack, OC-SORT, C-BIoU et ByteTrack sur les ensembles de données DanceTrack et KITTI-car, augmentant HOTA respectivement de 2,64 et 2,11 points, tout en offrant une performance compétitive sur les ensembles de données MOT17, MOT20 et KITTI-piéton. Utilisant des détections disponibles publiquement, l'IMM-JHSE surpass presque toutes les autres méthodes MOT 2D et n'est devancé que par certaines méthodes MOT 3D -- dont certaines sont hors ligne -- sur l'ensemble de données KITTI-car. Par rapport aux méthodes de suivi par attention, l'IMM-JHSE montre une performance remarquablement similaire sur l'ensemble de données DanceTrack et les dépasse sur l'ensemble de données MOT17. Le code est disponible publiquement : https://github.com/Paulkie99/imm-jhse.