HyperAIHyperAI
il y a 11 jours

Tuer deux oiseaux d’un seul coup : entraînement efficace et robuste de réseaux de neurones convolutionnels pour la reconnaissance faciale par FC partielle

Xiang An, Jiankang Deng, Jia Guo, Ziyong Feng, Xuhan Zhu, Jing Yang, Tongliang Liu
Tuer deux oiseaux d’un seul coup : entraînement efficace et robuste de réseaux de neurones convolutionnels pour la reconnaissance faciale par FC partielle
Résumé

L’apprentissage d’embeddings de caractéristiques profondes discriminantes à l’aide de jeux de données à grande échelle (millions d’images) provenant du monde réel, combiné à une fonction de perte softmax basée sur une marge, constitue actuellement l’état de l’art en reconnaissance faciale. Toutefois, le coût mémoire et computationnel de la couche entièrement connectée (FC) augmente linéairement avec le nombre d’identités présentes dans l’ensemble d’entraînement. En outre, les grands jeux de données d’entraînement souffrent inévitablement de conflits inter-classes et d’une distribution longue-queue. Dans ce travail, nous proposons une variante de mise à jour parcimonieuse de la couche FC, nommée Partial FC (PFC). À chaque itération, seules les centres de classes positives et un sous-ensemble aléatoire de centres de classes négatives sont sélectionnés pour calculer la fonction de perte softmax à marge. Tous les centres de classes sont toutefois conservés tout au long du processus d’entraînement, mais seul un sous-ensemble est sélectionné et mis à jour à chaque itération. Par conséquent, les exigences computationnelles, la probabilité de conflits inter-classes et la fréquence des mises à jour passives des centres de classes rares sont considérablement réduites. Des expériences étendues menées sur divers jeux de données d’entraînement et architectures (par exemple, CNN et ViT) confirment l’efficacité, la robustesse et l’efficience de la méthode proposée PFC. Le code source est disponible à l’adresse suivante : \https://github.com/deepinsight/insightface/tree/master/recognition.

Tuer deux oiseaux d’un seul coup : entraînement efficace et robuste de réseaux de neurones convolutionnels pour la reconnaissance faciale par FC partielle | Articles de recherche récents | HyperAI