Re-Identification de Personnes Faiblement Supervisée : Apprentissage Graphique Différentiable et un Nouveau Benchmark

La réidentification de personnes (Re-ID) bénéficie grandement des annotations précises des ensembles de données existants (par exemple, CUHK03 [1] et Market-1501 [2]), qui sont assez coûteuses car chaque image dans ces ensembles doit être associée à une étiquette appropriée. Dans ce travail, nous facilitons l'annotation de la Re-ID en remplaçant les annotations précises par des annotations imprécises, c'est-à-dire que nous regroupons les images en sacs selon le temps et attribuons une étiquette au niveau du sac à chaque sac. Cela réduit considérablement l'effort d'annotation et conduit à la création d'un ensemble de référence de grande échelle pour la Re-ID appelé SYSU-30$k$. Le nouveau benchmark contient 30 000 individus, soit environ 20 fois plus que CUHK03 (1 300 individus) et Market-1501 (1 500 individus), et 30 fois plus que ImageNet (1 000 catégories). Il comprend au total 29 606 918 images. L'apprentissage d'un modèle de Re-ID avec des annotations au niveau du sac est appelé le problème de Re-ID faiblement supervisé. Pour résoudre ce problème, nous introduisons un modèle graphique différentiable pour capturer les dépendances entre toutes les images d'un sac et générer une étiquette pseudo-fiable pour chaque image de personne. Cette étiquette pseudo-fiable est ensuite utilisée pour superviser l'apprentissage du modèle de Re-ID. Comparée aux modèles de Re-ID entièrement supervisés, notre méthode atteint des performances de pointe sur SYSU-30$k$ ainsi que sur d'autres ensembles de données. Le code, l'ensemble de données et le modèle préentraîné seront disponibles à l'adresse \url{https://github.com/wanggrun/SYSU-30k}.