HyperAIHyperAI
vor 2 Monaten

Wing-Verlust für robuste Faciale-Landmark-Lokalisierung mit Faltungsneuronalen Netzen

Zhen-Hua Feng; Josef Kittler; Muhammad Awais; Patrik Huber; Xiao-Jun Wu
Wing-Verlust für robuste Faciale-Landmark-Lokalisierung mit Faltungsneuronalen Netzen
Abstract

Wir präsentieren eine neue Verlustfunktion, die Wing-Verlustfunktion, für eine robuste Lokalisierung von Gesichtspunkten mit Faltungsneuralen Netzen (CNNs). Zunächst vergleichen und analysieren wir verschiedene Verlustfunktionen, darunter L2, L1 und glatte L1. Die Analyse dieser Verlustfunktionen zeigt, dass bei der Trainierung eines CNN-basierten Lokalisierungsmodells mehr Aufmerksamkeit auf kleine und mittlere Fehlerbereiche gerichtet werden sollte. Zu diesem Zweck entwickeln wir eine stückweise definierte Verlustfunktion. Die neue Verlustfunktion verstärkt den Einfluss von Fehlern im Intervall (-w, w), indem sie von der L1-Verlustfunktion zu einer modifizierten Logarithmusfunktion wechselt.Um das Problem der Unterrepräsentation von Proben mit großen außerplanaren Kopfdrehungen im Trainingsdatensatz anzugehen, schlagen wir eine einfache aber effektive Boosting-Strategie vor, die als posebasiertes Datenbalancing bezeichnet wird. Insbesondere behandeln wir das Problem der Datenungleichverteilung, indem wir die Minderheitsproben duplizieren und durch zufällige Bildrotation, Verschiebung des Begrenzungsrahmens und andere Methoden der Datenaugmentierung stören. Schließlich wird der vorgeschlagene Ansatz erweitert, um einen zweistufigen Rahmen für eine robuste Gesichtspunkt-Lokalisierung zu schaffen. Die experimentellen Ergebnisse, die auf AFLW und 300W erhalten wurden, zeigen die Vorteile der Wing-Verlustfunktion und beweisen die Überlegenheit der vorgeschlagenen Methode gegenüber den Stand-of-the-Art-Ansätzen.