HyperAIHyperAI
il y a 2 mois

Estimation détaillée de l'âge dans des conditions réelles avec des réseaux LSTM à attention

Zhang, Ke ; Liu, Na ; Yuan, Xingfang ; Guo, Xinyao ; Gao, Ce ; Zhao, Zhenbing ; Ma, Zhanyu
Estimation détaillée de l'âge dans des conditions réelles avec des réseaux LSTM à attention
Résumé

L'estimation de l'âge à partir d'une seule image faciale est une tâche essentielle dans les domaines de l'interaction homme-machine et de la vision par ordinateur, qui possède une large gamme de valeurs pratiques d'application. La précision de l'estimation de l'âge des images faciales en conditions réelles est relativement faible pour les méthodes existantes, car celles-ci ne prennent en compte que les caractéristiques globales, négligeant ainsi les caractéristiques fines des zones sensibles à l'âge. Nous proposons une nouvelle méthode basée sur notre réseau à mémoire à court et long terme avec mécanisme d'attention (AL) pour l'estimation fine de l'âge en conditions réelles, inspirée par les catégories fines et le mécanisme d'attention visuelle.Cette méthode combine les modèles de réseaux résiduels (ResNets) ou de réseaux résiduels de réseaux résiduels (RoR) avec des unités LSTM pour construire des réseaux AL-ResNets ou AL-RoR, permettant d'extraire les caractéristiques locales des régions sensibles à l'âge, ce qui améliore efficacement la précision de l'estimation de l'âge. Tout d'abord, un modèle ResNets ou RoR pré-entraîné sur le jeu de données ImageNet est sélectionné comme modèle de base, puis il est affiné sur le jeu de données IMDB-WIKI-101 pour l'estimation de l'âge. Ensuite, nous affinons les ResNets ou le RoR sur les jeux de données cibles d'âge pour extraire les caractéristiques globales des images faciales.Pour extraire les caractéristiques locales des régions sensibles à l'âge, une unité LSTM est ensuite utilisée pour obtenir automatiquement les coordonnées de la région sensible à l'âge. Enfin, la classification par groupe d'âge est effectuée directement sur le jeu de données Adience, et des expériences d'estimation par régression sont réalisées par l'algorithme Deep EXpectation (DEX) sur les jeux de données MORPH Album 2, FG-NET et 15/16LAP. En combinant les caractéristiques globales et locales, nous obtenons nos résultats finaux prédits.Les résultats expérimentaux illustrent l'efficacité et la robustesse de la méthode proposée AL-ResNets ou AL-RoR pour l'estimation de l'âge en conditions réelles, où elle atteint une performance supérieure à celle des autres réseaux neuronaux convolutifs.