Tiefe Regressionswälder für Altersschätzung

Das Alter schätzen auf der Grundlage von Gesichtsbildern wird in der Regel als ein Problem der nichtlinearen Regression betrachtet. Die Hauptausforderung bei diesem Problem ist die Heterogenität des Gesichtermerkmalraums im Bezug auf Altersgruppen, bedingt durch die große Variation des Gesichtsaussehens verschiedener Personen desselben Alters und die nichtstationäre Natur von Älterungsmustern. In dieser Arbeit schlagen wir tiefgreifende Regressionswälder (Deep Regression Forests, DRFs) vor, ein End-to-End-Modell für das Altersschätzen. DRFs verbinden die Aufteilungsknoten mit einer vollständig verbundenen Schicht eines Faltungsneuronalen Netzes (Convolutional Neural Network, CNN) und behandeln heterogene Daten durch gemeinsames Lernen von eingegebendatenabhängigen Partitionen in den Aufteilungsknoten und Datenabstraktionen in den Blattknoten. Dieses gemeinsame Lernen folgt einer alternierenden Strategie: Zunächst werden die Aufteilungsknoten sowie die Parameter des CNN unter Festhaltung der Blattknoten durch Backpropagation optimiert; Anschließend werden die Blattknoten unter Festhaltung der Aufteilungsknoten durch eine schrittweitenfreie und schnell konvergierende Aktualisierungsregel optimiert, die aus der Variationsbegrenzung abgeleitet wurde. Wir überprüfen die vorgeschlagenen DRFs anhand dreier standardisierter Benchmarks für Altersschätzung und erzielen dabei den aktuellen Stand der Technik in allen drei Benchmarks.