Deep Face Recognition

Das Ziel dieses Papers ist die Gesichtserkennung – entweder aus einem einzigen Foto oder aus einer Reihe von Gesichtern, die in einem Video verfolgt werden. Die jüngsten Fortschritte auf diesem Gebiet beruhen auf zwei Faktoren: (i) dem end-to-end-Lernen für die Aufgabe mittels eines konvolutionellen neuronalen Netzes (CNN) und (ii) der Verfügbarkeit sehr großer Trainingsdatensätze. Wir leisten zwei Beiträge: Erstens zeigen wir, wie ein extrem großer Datensatz (2,6 Millionen Bilder, über 2.600 Personen) durch eine Kombination aus Automatisierung und menschlicher Beteiligung (human-in-the-loop) zusammengestellt werden kann, und diskutieren die Abwägung zwischen Datensäuberkeit und Zeitaufwand. Zweitens durchleuchten wir die Komplexitäten des Trainings tiefer neuronalen Netze sowie der Gesichtserkennung, um Methoden und Verfahren vorzustellen, die vergleichbare Ergebnisse auf dem etablierten LFW- und YTF-Gesichtsbenchmark erzielen.