HyperAIHyperAI
vor 17 Tagen

FP-Age: Nutzung der Gesichtsaufteilungs-Attention zur Gesichtsaltersschätzung in freier Umgebung

Yiming Lin, Jie Shen, Yujiang Wang, Maja Pantic
FP-Age: Nutzung der Gesichtsaufteilungs-Attention zur Gesichtsaltersschätzung in freier Umgebung
Abstract

Die altersbasierte Altersschätzung aus Gesichtsbildern zielt darauf ab, das Alter einer Person aus Gesichtsbildern vorherzusagen. Sie findet in einer Vielzahl realer Anwendungen Verwendung. Obwohl end-to-end tiefe Modelle beachtliche Ergebnisse bei der Altersschätzung auf Benchmark-Datensätzen erzielt haben, bleibt ihre Leistung in natürlichen Umgebungen (in-the-wild) weiterhin unzureichend, da große Variationen in Kopfposition, Gesichtsausdrücken und Verdeckungen die Aufgabe erschweren. Um dieses Problem anzugehen, schlagen wir eine einfache, jedoch wirksame Methode vor, die facialen Semantik explizit in die Altersschätzung integriert, sodass das Modell lernt, sich unabhängig von Kopfposition und nicht-rigidem Deformation korrekt auf die informativsten Gesichtsbestandteile aus ungealignierten Gesichtsbildern zu konzentrieren. Dazu entwerfen wir ein auf Gesichtsparsing basierendes Netzwerk zur Lernung semantischer Informationen auf verschiedenen Skalen sowie ein neuartiges Gesichtsparsing-Attention-Modul, um diese semantischen Merkmale für die Altersschätzung zu nutzen. Um unsere Methode auf in-the-wild-Daten zu evaluieren, führen wir außerdem einen neuen, herausfordernden, großskaligen Benchmark namens IMDB-Clean ein. Dieser Datensatz wird durch eine halbautomatische Bereinigung des rauschhaften IMDB-WIKI-Datensatzes mittels einer eingeschränkten Clustermethode erstellt. In umfassenden Experimenten auf IMDB-Clean und weiteren Benchmark-Datensätzen, sowohl unter intra-dataset- als auch unter cross-dataset-Evaluierungsprotokollen, zeigen wir, dass unsere Methode stets alle bestehenden Ansätze für die Altersschätzung übertrifft und eine neue state-of-the-art-Leistung erzielt. Sofern uns bekannt ist, stellt unsere Arbeit den ersten Versuch dar, Gesichtsparsing-Attention zur Erreichung einer semantikbewussten Altersschätzung einzusetzen, was möglicherweise für andere hochwertige Aufgaben der Gesichtsanalyse inspirierend sein könnte. Der Quellcode und die Daten sind unter \url{https://github.com/ibug-group/fpage} verfügbar.