HyperAIHyperAI
il y a 11 jours

Repenser la compétition entre la détection et le ReID dans le suivi multi-objets

Chao Liang, Zhipeng Zhang, Xue Zhou, Bing Li, Shuyuan Zhu, Weiming Hu
Repenser la compétition entre la détection et le ReID dans le suivi multi-objets
Résumé

En raison de leur équilibre entre précision et vitesse, les modèles à une seule phase qui apprennent simultanément les représentations de détection et d’identification ont suscité un grand intérêt dans le suivi d’objets multiples (MOT). Toutefois, les différences intrinsèques et les relations entre la détection et la réidentification (ReID) sont inconsciemment négligées, du fait de leur traitement comme deux tâches isolées dans le cadre des méthodes à une seule phase. Cela entraîne des performances inférieures par rapport aux méthodes à deux phases existantes. Dans cet article, nous analysons d’abord le processus de raisonnement sous-jacent à ces deux tâches, ce qui révèle que la compétition entre elles entraîne inévitablement une dégradation de l’apprentissage des représentations dépendantes de la tâche. Pour résoudre ce problème, nous proposons un nouveau réseau réciproque (REN) basé sur une conception de relations propres et croisées, afin de favoriser une meilleure apprentissage des représentations dépendantes de la tâche dans chaque branche. Le modèle proposé vise à atténuer la compétition néfaste entre les tâches tout en renforçant la coopération entre la détection et la ReID. Par ailleurs, nous introduisons un réseau d’attention sensible à l’échelle (SAAN), qui prévient les désalignements au niveau sémantique afin d’améliorer la capacité d’association des représentations d’identité. En intégrant ces deux réseaux soigneusement conçus dans un système de suivi en ligne à une seule phase, nous développons un suiveur MOT performant, nommé CSTrack. Notre méthode atteint des performances de pointe sur les jeux de données MOT16, MOT17 et MOT20, sans recourir à des améliorations supplémentaires. En outre, CSTrack est efficace et fonctionne à 16,4 FPS sur une seule GPU moderne, tandis que sa version légère atteint 34,6 FPS. Le code complet est disponible à l’adresse suivante : https://github.com/JudasDie/SOTS.

Repenser la compétition entre la détection et le ReID dans le suivi multi-objets | Articles de recherche récents | HyperAI