HyperAIHyperAI
il y a 17 jours

Apprentissage de la désentrelacs des scènes pour la réidentification de personnes

Xianghao Zang, Ge Li, Wei Gao, Xiujun Shu
Apprentissage de la désentrelacs des scènes pour la réidentification de personnes
Résumé

Il existe de nombreux problèmes complexes dans la tâche de réidentification de personnes (ReID), tels que l’occlusion et la variation d’échelle. Les travaux existants tentent généralement de les résoudre en utilisant un réseau à branche unique. Ce type de réseau doit être robuste face à diverses difficultés, ce qui le surcharge considérablement. Ce papier propose une approche de type « diviser pour régner » pour la tâche de ReID. À cette fin, nous utilisons plusieurs opérations d’auto-supervision pour simuler différentes conditions difficiles, et traitons chaque problème spécifique à l’aide de réseaux distincts. Plus précisément, nous employons l’opération de suppression aléatoire (random erasing) et proposons une nouvelle opération de mise à l’échelle aléatoire afin de générer de nouvelles images aux caractéristiques contrôlables. Un réseau multi-branche général, composé d’une branche principale (master branch) et de deux branches secondaires (servant branches), est introduit pour traiter différents scénarios. Ces branches apprennent de manière collaborative et acquièrent des capacités perceptive différentes. Ainsi, les scénarios complexes dans la tâche de ReID sont efficacement décomposés, et la charge de chaque branche est allégée. Les résultats d’expériences étendues démontrent que la méthode proposée atteint des performances de pointe sur trois benchmarks de ReID ainsi que sur deux benchmarks de ReID avec occlusion. Une étude d’ablation confirme également que le schéma et les opérations proposés améliorent significativement les performances dans divers scénarios. Le code est disponible à l’adresse suivante : https://git.openi.org.cn/zangxh/LDS.git.