HyperAIHyperAI
il y a 7 jours

Recherche efficace de personnes : une approche sans ancrage

Yichao Yan, Jinpeng Li, Jie Qin, Shengcai Liao, Xiaokang Yang
Recherche efficace de personnes : une approche sans ancrage
Résumé

La recherche de personnes vise à localiser et à identifier simultanément une personne cible à partir d’images réalistes non rognées. Pour atteindre cet objectif, les modèles de pointe s’appuient généralement sur des détecteurs en deux étapes comme Faster R-CNN, auxquels est ajoutée une branche de ré-identification (re-id). Grâce à l’opération ROI-Align, cette approche permet d’obtenir une précision prometteuse, car les caractéristiques de re-id sont explicitement alignées avec les régions correspondantes des objets. Toutefois, elle entraîne également un surcoût computationnel élevé en raison des nombreuses ancres d’objets denses. Dans ce travail, nous proposons une approche sans ancres afin de traiter efficacement cette tâche exigeante, en introduisant les aménagements suivants. Premièrement, nous choisissons un détecteur sans ancres (à savoir FCOS) comme prototype de notre architecture. Du fait de l’absence d’ancres d’objets denses, ce détecteur présente une efficacité nettement supérieure par rapport aux modèles existants de recherche de personnes. Deuxièmement, lorsqu’on adapte directement ce détecteur sans ancres à la recherche de personnes, plusieurs défis majeurs apparaissent dans l’apprentissage de caractéristiques de re-id robustes, que nous résumons sous la forme d’incidences d’alignement à différents niveaux (échelle, région, tâche). Pour résoudre ces problèmes, nous proposons un module d’agrégation de caractéristiques alignées afin de générer des représentations de caractéristiques plus discriminantes et robustes. Par conséquent, nous nommons notre modèle Réseau d’alignement de caractéristiques pour la recherche de personnes (AlignPS). Troisièmement, en analysant les avantages respectifs des modèles basés sur des ancres et des modèles sans ancres, nous enrichissons ultérieurement AlignPS d’une tête ROI-Align, ce qui améliore significativement la robustesse des caractéristiques de re-id tout en maintenant une haute efficacité. Des expériences étendues menées sur deux benchmarks exigeants (CUHK-SYSU et PRW) démontrent que notre cadre atteint des performances au niveau de l’état de l’art ou compétitives, tout en affichant une efficacité supérieure. Tous les codes sources, les données et les modèles entraînés sont disponibles à l’adresse suivante : https://github.com/daodaofr/alignps.

Recherche efficace de personnes : une approche sans ancrage | Articles de recherche récents | HyperAI