Deep Alignment Network: Ein Faltungsneuronales Netzwerk für robuste Gesichtsausrichtung

In dieser Arbeit schlagen wir das Deep Alignment Network (DAN) vor, eine robuste Methode zur Gesichtsausrichtung, die auf einer tiefen Neuronalen Netzwerkarchitektur basiert. DAN besteht aus mehreren Stufen, bei denen jede Stufe die Positionen der im vorherigen Schritt geschätzten Gesichtspunkte verbessert. Unser Verfahren verwendet vollständige Gesichtsbilder in allen Stufen, im Gegensatz zu den kürzlich vorgeschlagenen Gesichtsausrichtungsmethoden, die auf lokalen Bildausschnitten basieren. Dies ist durch die Verwendung von Landmark-Heatmaps möglich, die visuelle Informationen über die in den früheren Stufen des Algorithmus geschätzten Landmark-Positionen liefern. Die Verwendung von vollständigen Gesichtsbildern anstelle von Ausschnitten ermöglicht es dem DAN, Gesichtsbilder mit großer Variation der Kopfhaltung und schwierigen Initialisierungen zu verarbeiten. Eine umfangreiche Auswertung anhand zweier öffentlich zugänglicher Datensätze zeigt, dass DAN den aktuellen Fehlerquoten bis zu 70% reduziert. Unser Verfahren wurde zudem als Teil der Menpo-Challenge zur Bewertung eingereicht.