SCAF: Sprungverbindungen in Auto-Encodern zur Gesichtsalignment mit wenigen annotierten Daten

Überwachte Methoden zur Gesichtsausrichtung erfordern große Mengen an Trainingsdaten, um eine hohe Genauigkeit und Verallgemeinerungsfähigkeit zu erreichen. Allerdings umfassen Gesichtsausrichtungsdatensätze selten mehr als einige Tausend Samples, wodurch diese Methoden anfällig für Overfitting am spezifischen Trainingsdatensatz sind. Semi-überwachte Ansätze wie TS3 oder 3FabRec sind entstanden, um dieses Problem zu mildern, indem sie sowohl gelabelte als auch ungelabelte Daten während des Trainings nutzen. In diesem Paper stellen wir SCAF (Skip-Connections in Auto-encoder for Face alignment) vor. Wir bauen auf 3FabRec auf, indem wir Skip-Connections zwischen Encoder und Decoder hinzufügen. Diese Skip-Connections führen zu einer verbesserten Vorhersage von Merkmalspunkten, insbesondere bei anspruchsvollen Beispielen. Zudem führen wir erstmals Active Learning für die Aufgabe der Gesichtsausrichtung ein und stellen eine neue Akquisitionsfunktion, die Negative Neighborhood Magnitude, vor, die speziell darauf ausgelegt ist, die Qualität von Heatmaps zu bewerten. Beide Vorschläge zeigen ihre Wirksamkeit auf mehreren Gesichtsausrichtungsdatensätzen, insbesondere bei begrenzten Trainingsdaten.