HyperAIHyperAI
il y a 17 jours

File d'attente de classes dynamique pour la reconnaissance faciale à grande échelle dans des conditions réelles

Bi Li, Teng Xi, Gang Zhang, Haocheng Feng, Junyu Han, Jingtuo Liu, Errui Ding, Wenyu Liu
File d'attente de classes dynamique pour la reconnaissance faciale à grande échelle dans des conditions réelles
Résumé

L’apprentissage de représentations discriminatives à l’aide de grands jeux de données faciaux recueillis dans le monde réel est essentiel pour les applications du monde réel, mais il demeure un défi majeur. Les difficultés proviennent de multiples facteurs, et ce travail se concentre sur deux problèmes clés : la contrainte des ressources informatiques et la distribution longue-queue des classes. Récemment, l’apprentissage de représentations basé sur la classification, combiné à des réseaux de neurones profonds et à des fonctions de perte soigneusement conçues, a démontré de bonnes performances de reconnaissance. Toutefois, les coûts informatiques et mémoire augmentent linéairement en fonction du nombre d’identités (classes) présentes dans l’ensemble d’entraînement, et le processus d’apprentissage souffre d’un déséquilibre entre les classes. Dans ce travail, nous proposons une file dynamique de classes (Dynamic Class Queue, DCQ) afin de relever ces deux défis. Plus précisément, à chaque itération durant l’entraînement, un sous-ensemble de classes est sélectionné dynamiquement pour la reconnaissance, et leurs poids de classe sont générés en temps réel et stockés dans une file. Comme seul un sous-ensemble de classes est utilisé à chaque itération, la charge computationnelle est réduite. En utilisant un seul serveur sans parallélisation de modèle, nous vérifions empiriquement, sur des jeux de données à grande échelle, que l’utilisation de seulement 10 % des classes suffit à atteindre des performances comparables à celles obtenues avec l’ensemble des classes. De plus, les poids de classe sont générés de manière à la manière « few-shot », ce qui les rend particulièrement adaptés aux classes rares, comprenant peu d’exemples. Nous montrons une amélioration significative par rapport à une base solide sur le plus grand jeu de données public disponible, le Megaface Challenge2 (MF2), qui comporte 672 000 identités, dont plus de 88 % disposent de moins de 10 instances. Le code source est disponible à l’adresse suivante : https://github.com/bilylee/DCQ