HyperAIHyperAI
il y a 17 jours

Alignement du visage avec un réseau de neurones profond à densité de noyau

{ Qiang Ji, Hui Su, Lisha Chen}
Alignement du visage avec un réseau de neurones profond à densité de noyau
Résumé

Les réseaux neuronaux profonds atteignent de bons résultats dans de nombreux problèmes de vision par ordinateur, tels que l’alignement facial. Toutefois, lorsque l’image de test est difficile à traiter en raison d’une faible résolution, d’occlusions ou de perturbations adverses, la précision d’un réseau neuronal profond diminue fortement. Il est donc essentiel de quantifier l’incertitude de ses prédictions. Un réseau neuronal probabiliste utilisant une distribution gaussienne sur la cible est généralement employé pour estimer l’incertitude dans les problèmes de régression. Toutefois, dans les problèmes du monde réel, en particulier dans les tâches de vision par ordinateur, l’hypothèse gaussienne est trop restrictive. Pour modéliser des distributions plus générales, telles que des distributions multimodales ou asymétriques, nous proposons de développer un réseau neuronal profond basé sur une estimation par densité à noyau. Plus précisément, pour l’alignement facial, nous adaptons le réseau à grillette d’état de l’art (hourglass network) dans un cadre de réseau neuronal probabiliste, dont la sortie est une carte de probabilité des points d’ancrage (landmark probability map). Le modèle est entraîné en maximisant la vraisemblance conditionnelle logarithmique. Pour exploiter efficacement la carte de probabilité de sortie, nous étendons le modèle à plusieurs étapes, permettant aux cartes de logits issues d’une étape précédente d’alimenter l’étape suivante, afin d’améliorer progressivement la précision de détection des points d’ancrage. Des expériences étendues sur des jeux de données standard, comparées aux méthodes de deep learning les plus avancées non contraintes, montrent que le réseau à densité à noyau proposé atteint une performance comparable ou supérieure en termes de précision de prédiction, tout en fournissant une estimation d’incertitude aleatoire (aleatoric uncertainty) dans les prédictions.