HyperAIHyperAI
il y a 2 mois

Un réseau de neurones convolutif léger pour une représentation profonde des visages avec des étiquettes bruitées

Wu, Xiang ; He, Ran ; Sun, Zhenan ; Tan, Tieniu
Un réseau de neurones convolutif léger pour une représentation profonde des visages avec des étiquettes bruitées
Résumé

Le nombre de modèles de réseaux neuronaux convolutifs (CNN) proposés pour la reconnaissance faciale n'a cessé d'augmenter afin de mieux s'adapter à de grandes quantités de données d'entraînement. Lorsque les données d'entraînement sont collectées sur Internet, les étiquettes sont susceptibles d'être ambiguës et inexactes. Cet article présente un cadre Light CNN permettant d'apprendre une représentation compacte sur des données faciales à grande échelle avec de nombreuses étiquettes bruyantes. Tout d'abord, nous introduisons une variante de l'activation maxout, appelée Max-Feature-Map (MFM), dans chaque couche convolutive du CNN. Contrairement à l'activation maxout qui utilise de nombreuses cartes de caractéristiques pour approximer linéairement une fonction d'activation convexe arbitraire, le MFM le fait par le biais d'une relation compétitive. Le MFM peut non seulement séparer les signaux bruyants des signaux informatifs, mais aussi jouer le rôle de sélection de caractéristiques entre deux cartes de caractéristiques. Deuxièmement, trois réseaux ont été soigneusement conçus pour améliorer les performances tout en réduisant le nombre de paramètres et les coûts computationnels. Enfin, une méthode de bootstrap sémantique est proposée pour rendre les prédictions des réseaux plus cohérentes avec les étiquettes bruyantes. Les résultats expérimentaux montrent que le cadre proposé peut utiliser des données à grande échelle et bruyantes pour apprendre un modèle Light qui est efficace en termes de coûts computationnels et d'espace de stockage. Le réseau unique appris avec une représentation 256-D obtient des résultats au niveau de l'état de l'art sur diverses bases de données faciales sans ajustement fin. Le code est disponible sur https://github.com/AlfredXiangWu/LightCNN.

Un réseau de neurones convolutif léger pour une représentation profonde des visages avec des étiquettes bruitées | Articles de recherche récents | HyperAI