Deep Expectation of Real and Apparent Age from a Single Image Without Facial Landmarks

In diesem Paper stellen wir eine Deep-Learning-Lösung für die Altersschätzung aus einer einzelnen Gesichtsaufnahme vor, die auf die Verwendung von Gesichtslandmarken verzichtet, und führen zudem die IMDB-WIKI-Datenbank ein, die bislang größte öffentlich verfügbare Datensammlung von Gesichtsbildern mit Alters- und Geschlechtslabels. Während die Forschung zur realen Altersschätzung bereits mehrere Jahrzehnte zurückreicht, ist die Untersuchung der scheinbaren Altersschätzung – also des Alters, wie es durch andere Menschen aus einem Gesichtsbild wahrgenommen wird – ein jüngeres Forschungsfeld. Wir bearbeiten beide Aufgaben mit unseren konvolutionellen neuronalen Netzwerken (CNNs) mit VGG-16-Architektur, die zunächst auf ImageNet für die Bildklassifikation vortrainiert wurden. Wir formulieren das Problem der Altersschätzung als tiefes Klassifikationsproblem, gefolgt von einer Verbesserung des erwarteten Wertes mittels Softmax. Die Schlüsselelemente unserer Lösung sind: tiefgelernte Modelle aus großen Datensätzen, robuste Gesichtsausrichtung und die Verwendung einer Erwartungswertformulierung für die Altersregression. Wir validieren unsere Methoden an etablierten Benchmarks und erreichen dabei Stand-der-Kunst-Ergebnisse sowohl für die reale als auch für die scheinbare Altersschätzung.