Gesichtserkennung mit tiefen Mehrpose-Darstellungen

Wir stellen unsere Methode und unser System zur Gesichtserkennung mit mehreren pose-bewussten tiefen Lernmodellen vor. In unserer Darstellung wird ein Gesichtsbild durch mehrere pose-spezifische Deep Convolutional Neural Network (CNN)-Modelle verarbeitet, um mehrere pose-spezifische Merkmale zu generieren. 3D-Rendering wird verwendet, um aus dem Eingangsbild mehrere Gesichtsposen zu erzeugen. Die Empfindlichkeit des Erkennungssystems gegenüber Posevariationen wird reduziert, da wir eine Ensemble von pose-spezifischen CNN-Merkmalen verwenden. Der Artikel präsentiert umfangreiche experimentelle Ergebnisse zum Einfluss der Landmarkendetektion, der Auswahl von CNN-Schichten und der Auswahl von Pose-Modellen auf die Leistung der Erkennungs Pipeline. Unsere neuartige Darstellung erzielt bessere Ergebnisse als der Stand der Technik bei IARPA's CS2 und NIST's IJB-A sowohl in Verifikations- als auch in Identifikationsaufgaben (d.h. Suchaufgaben).