CosFace : Perte Cosinus à Marge Large pour la Reconnaissance Faciale Profonde

La reconnaissance faciale a connu des progrès extraordinaires grâce à l'avancement des réseaux de neurones convolutifs profonds (CNNs). La tâche centrale de la reconnaissance faciale, incluant la vérification et l'identification faciales, implique la discrimination des caractéristiques faciales. Cependant, la perte softmax traditionnelle des CNNs profonds manque généralement de puissance discriminante. Pour résoudre ce problème, plusieurs fonctions de perte ont été récemment proposées, telles que la perte de centre, la grande marge softmax loss et la perte softmax angulaire. Toutes ces fonctions de perte améliorées partagent la même idée : maximiser la variance inter-classe et minimiser la variance intra-classe. Dans cet article, nous proposons une nouvelle fonction de perte, appelée grande marge cosine loss (LMCL), pour réaliser cette idée sous un angle différent. Plus précisément, nous reformulons la perte softmax en une perte cosinus en normalisant les caractéristiques et les vecteurs de poids par $L_2$ pour éliminer les variations radiales, sur cette base est introduit un terme de marge cosinus pour maximiser davantage l'écart décisionnel dans l'espace angulaire. Par conséquent, une variance intra-classe minimale et une variance inter-classe maximale sont atteintes grâce à la normalisation et à la maximisation de l'écart décisionnel cosinus. Nous désignons notre modèle formé avec LMCL comme CosFace. De nombreuses évaluations expérimentales ont été réalisées sur les ensembles de données les plus populaires du domaine public pour la reconnaissance faciale, tels que le défi MegaFace, Youtube Faces (YTF) et Labeled Faces in the Wild (LFW). Nous obtenons des performances d'état de l'art sur ces benchmarks, ce qui confirme l'efficacité de notre approche proposée.