HyperAIHyperAI
il y a 18 jours

Réseau adversaire de suppression d’occlusion générative incrémentale pour la réidentification de personnes

{Liang Wang, Jun Wu, Shanshan Zhang, Shuguang Dou, Xinbi Lv, Cairong Zhao}
Réseau adversaire de suppression d’occlusion générative incrémentale pour la réidentification de personnes
Résumé

La réidentification de personnes (re-id) fait face au défi majeur de l’occlusion, où une image contient des zones occluses et une information discriminante réduite sur les piétons. Toutefois, certaines recherches s’efforcent de concevoir des modules complexes afin de capturer des informations implicites (telles que les points de repère de posture humaine, les cartes de masque ou encore les informations spatiales). Le réseau, par conséquent, se concentre sur l’apprentissage de caractéristiques discriminantes sur les régions non occlues du corps humain, permettant ainsi une correspondance efficace malgré des désalignements spatiaux. Peu d’études se sont penchées sur la génération de données (data augmentation), étant donné que les méthodes existantes de renforcement des données basées sur une seule source apportent des améliorations limitées en performance. Pour atténuer le problème d’occlusion, nous proposons un nouveau réseau, appelé Incremental Generative Occlusion Adversarial Suppression (IGOAS). Il se compose de deux composants principaux : 1) un bloc incrémental de génération d’occlusion, qui génère des données d’occlusion progressivement plus difficiles, permettant ainsi au réseau d’acquérir une robustesse accrue face aux occlusions en apprenant progressivement des cas plus complexes, plutôt que de commencer directement par les cas les plus extrêmes ; et 2) un cadre d’adversarial suppression globale (G&A), comprenant une branche globale et une branche d’adversarial suppression. La branche globale extrait des caractéristiques globales stables des images. La branche d’adversarial suppression, intégrant deux modules de suppression d’occlusion, minimise la réponse aux occlusions générées tout en renforçant la représentation des caractéristiques attentives sur les zones non occlues du corps humain. Enfin, en concaténant les caractéristiques provenant des deux branches, nous obtenons un descripteur de caractéristiques de piéton plus discriminant, robuste au problème d’occlusion. Les expérimentations menées sur un jeu de données occlu montrent des performances compétitives du modèle IGOAS : sur Occluded-DukeMTMC, il atteint une précision Rank-1 de 60,1 % et une mAP de 49,4 %.

Réseau adversaire de suppression d’occlusion générative incrémentale pour la réidentification de personnes | Articles de recherche récents | HyperAI