Robuste Gesichtsausrichtung durch ein Multi-Ordnungs-Hochpräzisions-Hourglass-Netzwerk

Die Heatmap Regression (HR) ist zu einem der Hauptansätze für die Gesichtsausrichtung geworden und hat unter eingeschränkten Bedingungen vielversprechende Ergebnisse erzielt. Allerdings verschlechtern sich die Leistungen von HR-Methoden erheblich, wenn ein Gesichtsbild große Posevariationen, starke Verdeckungen und komplizierte Beleuchtungsbedingungen aufweist. Dies liegt an den niedrigen Auflösungen der generierten Landmark-Heatmaps sowie der Vernachlässigung wichtiger hochrangiger Informationen, die zur Lernung differenzierbarerer Merkmale verwendet werden können. Um das Ausrichtungsproblem für Gesichter mit extrem großen Posen und starken Verdeckungen zu lösen, schlägt dieser Artikel eine Methode der Heatmap Subpixel Regression (HSR) sowie ein Multi-Order Cross Geometry-aware (MCG)-Modell vor, die nahtlos in ein neues Multi-Order High-Precision Hourglass Network (MHHN) integriert sind. Die HSR-Methode wurde entwickelt, um durch eine sorgfältig gestaltete Subpixel-Detektionsverlustfunktion (SDL) und Subpixel-Detektionstechnologie (SDT) eine hochpräzise Landmarkenerkennung zu erreichen. Gleichzeitig ist das MCG-Modell in der Lage, die vorgeschlagenen hochrangigen Querverbindungen zu nutzen, um differenzierbarere Darstellungen zu lernen, die die gesichtsgeometrischen Restriktionen und Kontextinformationen verbessern. Nach bestem Wissen ist dies die erste Studie, die Heatmap Subpixel Regression zur robusten und hochpräzisen Gesichtsausrichtung untersucht. Die experimentellen Ergebnisse aus anspruchsvollen Benchmark-Datensätzen zeigen, dass unser Ansatz den aktuellen Stand der Technik in der Literatur übertrifft.