HyperAIHyperAI
vor 2 Monaten

FacePoseNet: Ein Plädoyer für Landmark-freie Gesichtsausrichtung

Fengju Chang; Anh Tuan Tran; Tal Hassner; Iacopo Masi; Ram Nevatia; Gerard Medioni
FacePoseNet: Ein Plädoyer für Landmark-freie Gesichtsausrichtung
Abstract

Wir zeigen, wie ein einfaches konvolutionsbasiertes neuronales Netzwerk (CNN) trainiert werden kann, um die sechs Freiheitsgrade (6DoF) der 3D-Kopfhaltung direkt aus Bildintensitäten genauer und robust zu regrieren. Des Weiteren erläutern wir, wie dieses FacePoseNet (FPN) als Alternative zur expliziten Erkennung von Gesichtspunkten für die Aufgaben der 2D- und 3D-Ausrichtung von Gesichtern eingesetzt werden kann. Wir behaupten, dass in vielen Fällen die üblichen Methoden zur Messung der Genauigkeit von Landmark-Detektoren irreführend sein können, wenn verschiedene Gesichtsausrichtungen miteinander verglichen werden. Stattdessen vergleichen wir unser FPN mit existierenden Methoden durch die Auswertung ihrer Auswirkungen auf die Genauigkeit der Gesichtserkennung anhand der Benchmarks IJB-A und IJB-B: unter Verwendung derselben Erkennungs Pipeline, aber mit variierender Gesichtsausrichtungsmethode. Unsere Ergebnisse zeigen, dass (a) eine höhere Genauigkeit der Landmark-Detektion, gemessen am Benchmark 300W, nicht unbedingt eine bessere Genauigkeit der Gesichtserkennung impliziert. (b) Unser FPN bietet eine überlegene 2D- und 3D-Gesichtsausrichtung bei beiden Benchmarks. Schließlich (c) aligniert das FPN Gesichter bei einem Bruchteil des Rechenaufwands vergleichbar genauer Landmark-Detektoren. Für viele Zwecke ist das FPN daher eine viel schnellere und genaue Methode zur Gesichtsausrichtung im Vergleich zum Einsatz von Gesichtspunktdetektoren.