Adaptive Variance-basierte Label-Verteilungs-Lernmethode für die Gesichtsalterabschätzung

Die Altersschätzung aus einer einzigen Gesichtsaufnahme ist ein klassisches und herausforderndes Thema in der Computer Vision. Ein besonders schwieriges Problem hierbei ist die Label-Ambiguität, d. h., Gesichtsaufnahmen einer Person aus benachbarten Altersstufen sind oft kaum unterscheidbar. Einige bestehende Methoden greifen auf die Verteilungslernung zurück, um dieses Problem zu bewältigen, indem sie die semantische Korrelation zwischen Alterslabels ausnutzen. Tatsächlich setzen die meisten dieser Ansätze für alle Bilder einen festen Wert für die Varianz der Gauss’schen Label-Verteilung an. Die Varianz ist jedoch eng mit der Korrelation zwischen benachbarten Altersstufen verknüpft und sollte sich sowohl über verschiedene Altersgruppen als auch zwischen verschiedenen Personen unterscheiden. Um eine auf den einzelnen Sample abgestimmte Varianz zu modellieren, schlagen wir in diesem Artikel eine adaptive Varianz-basierte Verteilungslernmethode (AVDL) für die Gesichtsalterschätzung vor. AVDL integriert einen datengetriebenen Optimierungsansatz, nämlich Meta-Lernen, um diese Aufgabe zu bewältigen. Konkret führt AVDL einen Meta-Gradientenabstieg auf der Variablen (d. h. der Varianz) durch, um den Verlust auf einem sauberen, verzerrungsfreien Validierungsset zu minimieren. Durch die adaptiv erlernte, geeignete Varianz für jedes einzelne Sample kann unsere Methode die wahre Alters-Wahrscheinlichkeitsverteilung effektiver approximieren. Umfangreiche Experimente auf den Datensätzen FG-NET und MORPH II belegen die Überlegenheit unseres vorgeschlagenen Ansatzes gegenüber bestehenden State-of-the-Art-Methoden.