VarGFaceNet : Un réseau de neurones convolutifs à groupes variables efficace pour la reconnaissance faciale légère

Pour améliorer les capacités de discrimination et de généralisation des réseaux légers pour la reconnaissance faciale, nous proposons un réseau de neurones à convolution par groupe variable efficace appelé VarGFaceNet. La convolution par groupe variable est introduite par VarGNet pour résoudre le conflit entre le coût computationnel faible et l'asymétrie de l'intensité computationnelle à l'intérieur d'un bloc. Nous utilisons la convolution par groupe variable pour concevoir notre réseau, qui peut supporter une identification faciale à grande échelle tout en réduisant le coût computationnel et le nombre de paramètres. Plus précisément, nous utilisons une configuration de tête pour conserver les informations essentielles au début du réseau et proposons une configuration d'embedding spécifique pour réduire les paramètres de la couche entièrement connectée utilisée pour l'embedding. Pour renforcer la capacité d'interprétation, nous employons une version équivalente de la perte de distillation angulaire pour guider notre réseau léger, et nous appliquons la distillation de connaissances récursive afin d'atténuer la disparité entre le modèle enseignant et le modèle étudiant. Le vainqueur du défi LFR (2019) sur la piste deepglint-light a démontré l'efficacité de notre modèle et approche. Une mise en œuvre de VarGFaceNet sera prochainement publiée sur https://github.com/zma-c-137/VarGFaceNet.