Command Palette
Search for a command to run...
Un CNN léger pour une représentation profonde du visage avec des étiquettes bruitées
Un CNN léger pour une représentation profonde du visage avec des étiquettes bruitées
Wu Xiang He Ran Sun Zhenan Tan Tieniu
Résumé
Le volume des modèles de réseaux de neurones convolutifs (CNN) proposés pour la reconnaissance faciale augmente continuellement afin de mieux s’adapter à de grandes quantités de données d’entraînement. Lorsque ces données d’entraînement proviennent d’internet, les étiquettes associées sont susceptibles d’être ambigües et inexactes. Ce papier présente un cadre Light CNN permettant d’apprendre une représentation compacte à partir de données faciales à grande échelle comportant un grand nombre d’étiquettes bruitées. Premièrement, nous introduisons une variante de l’activation maxout, appelée Max-Feature-Map (MFM), dans chaque couche convolutive du CNN. Contrairement à l’activation maxout, qui utilise plusieurs cartes de caractéristiques pour approximer de manière linéaire une fonction d’activation convexe arbitraire, la MFM le fait grâce à une relation compétitive entre cartes. La MFM permet non seulement de séparer les signaux bruités des signaux informatifs, mais joue également un rôle de sélection de caractéristiques entre deux cartes de caractéristiques. Deuxièmement, trois réseaux sont soigneusement conçus afin d’améliorer les performances tout en réduisant le nombre de paramètres et les coûts computationnels. Enfin, une méthode de bootstrap sémantique est proposée pour rendre les prédictions des réseaux plus cohérentes avec les étiquettes bruitées. Les résultats expérimentaux montrent que le cadre proposé permet d’utiliser efficacement de grandes quantités de données bruitées afin d’apprendre un modèle léger, à faible coût computationnel et faible consommation de mémoire. Le réseau unique appris, avec une représentation de 256 dimensions, atteint des performances de pointe sur diverses bases de tests sans nécessiter de fine-tuning. Le code source est disponible à l’adresse suivante : https://github.com/AlfredXiangWu/LightCNN.