HyperAIHyperAI
vor 18 Tagen

Effiziente und genaue Gesichtsalignment durch globale Regression und kaskadierte lokale Verfeinerung

{Zhe Wang, Haibin Ling, Chunyuan Liao, Jinzhan Su}
Effiziente und genaue Gesichtsalignment durch globale Regression und kaskadierte lokale Verfeinerung
Abstract

Trotz der erheblichen Fortschritte bei der Gesichtsbildausrichtung in den letzten Jahren verbleiben noch Verbesserungspotenziale bei Algorithmen zur Gesichtslandmarkenlokalisierung mit hoher Genauigkeit und hoher Geschwindigkeit, insbesondere für Anwendungen mit begrenzten Rechenressourcen. Um dieses Problem anzugehen, schlagen wir einen neuen Algorithmus zur Lokalisierung von Gesichtslandmarken vor, der globale Regression und lokale Verfeinerung kombiniert. Konkret schätzt unser Algorithmus zunächst über ein globales Regressionsnetzwerk (GRegNet) die globale Gesichtsform eines gegebenen Bildes ab und verwendet anschließend kaskadierte lokale Verfeinerungsnetzwerke (LRefNet), um die Ausrichtung schrittweise zu verbessern. Im Gegensatz zu früheren Ansätzen liegt der zentrale Innovationsbeitrag unserer Methode in der gemeinsamen Nutzung von tiefen Merkmalen aus GRegNet durch LRefNet. Diese Merkmalsfreigabe verbessert nicht nur erheblich die Effizienz des Algorithmus, sondern ermöglicht zudem eine umfassende Ausnutzung der reichen, lokalitätsrelevanten Details, die in den flachen Schichten des Netzwerks enthalten sind, was letztlich die Genauigkeit der Landmarkenlokalisierung signifikant steigert. Die Vorteile unseres Ansatzes werden in umfassenden Experimenten an vier etablierten Benchmarks für Gesichtsausrichtung – 300-W, AFLW, COFW und WFLW – eindeutig bestätigt. Auf allen Datensätzen erreicht unser Algorithmus die bisher beste Ausrichtungsgenauigkeit, während er gleichzeitig die geringste rechnerische Komplexität aufweist.