ArcFace : Perte de Marge Angulaire Additive pour la Reconnaissance Faciale Profonde

Récemment, une ligne de recherche populaire en reconnaissance faciale consiste à adopter des marges dans la fonction de perte softmax bien établie afin d'optimiser la séparabilité des classes. Dans cet article, nous introduisons d'abord une perte marginale angulaire additive (Additive Angular Margin Loss, ArcFace), qui non seulement possède une interprétation géométrique claire mais renforce également considérablement le pouvoir discriminant. Étant donné que l'ArcFace est sensible au bruit massif des étiquettes, nous proposons ensuite un ArcFace à sous-centres, où chaque classe comprend $K$ sous-centres et les échantillons d'entraînement n'ont besoin d'être proches que de l'un des $K$ sous-centres positifs. L'ArcFace à sous-centres favorise une sous-classe dominante contenant la majorité des visages propres et des sous-classes non dominantes incluant les visages difficiles ou bruyants. Grâce à cette isolation auto-propulsée, nous améliorons les performances en purifiant automatiquement les visages bruts extraits du web en présence de bruit réel massif. Outre l'embedding de caractéristiques discriminantes, nous explorons également le problème inverse, c'est-à-dire la cartographie des vecteurs de caractéristiques vers des images faciales. Sans entraîner aucun générateur ou discriminateur supplémentaire, le modèle ArcFace pré-entraîné peut générer des images faciales préservant l'identité pour les sujets tant à l'intérieur qu'à l'extérieur des données d'entraînement en utilisant uniquement le gradient du réseau et les a priori de normalisation par lots (Batch Normalization, BN). De nombreuses expériences montrent que l'ArcFace peut non seulement améliorer l'embedding de caractéristiques discriminantes mais aussi renforcer la synthèse générative de visages.