Apprentissage de la distribution des étiquettes basé sur la variance adaptative pour l'estimation de l'âge facial

L’estimation de l’âge à partir d’une seule image faciale constitue un problème classique et complexe en vision par ordinateur. L’un des défis les plus persistants réside dans l’ambiguïté des étiquettes, c’est-à-dire que les images faciales d’une même personne à des âges consécutifs sont souvent indiscernables. Certaines méthodes existantes tentent de résoudre ce problème en adoptant une approche d’apprentissage de distribution, en exploitant la corrélation sémantique entre les étiquettes d’âge. En réalité, la plupart d’entre elles attribuent une valeur fixe à la variance de la distribution gaussienne des étiquettes, quelle que soit l’image. Or, la variance est étroitement liée à la corrélation entre les âges adjacents et devrait varier selon les âges et les individus. Afin de modéliser une variance spécifique à chaque échantillon, nous proposons dans cet article une méthode d’apprentissage de distribution à variance adaptative (AVDL, Adaptive Variance based Distribution Learning) pour l’estimation de l’âge facial. AVDL intègre un cadre d’optimisation piloté par les données, appelé méta-apprentissage, pour atteindre cet objectif. Plus précisément, AVDL effectue une étape de descente de gradient méta sur la variable (c’est-à-dire la variance) afin de minimiser la perte sur un ensemble de validation propre et non biaisé. En apprenant de manière adaptative une variance appropriée pour chaque échantillon, notre méthode permet une approximation plus efficace de la distribution réelle de probabilité de l’âge. Des expériences étendues sur les jeux de données FG-NET et MORPH II démontrent la supériorité de notre approche par rapport aux méthodes les plus avancées existantes.