Command Palette
Search for a command to run...
STAR-Loss: Reduzierung semantischer Ambiguität in der Facial-Landmark-Detektion
STAR-Loss: Reduzierung semantischer Ambiguität in der Facial-Landmark-Detektion
Zhenglin Zhou extsuperscript1* Huaxia Li extsuperscript2* Hong Liu extsuperscript3* Nanyang Wang extsuperscript2 Gang Yu extsuperscript2 Rongrong Ji extsuperscript1†
Zusammenfassung
Kürzlich haben tiefe Lernalgorithmen basierende Methoden zur Erkennung von Gesichtslandmarken erhebliche Verbesserungen erzielt. Dennoch verschlechtert das Problem der semantischen Unschärfheit die Erkennungsleistung. Insbesondere führt die semantische Unschärfheit zu inkonsistenten Annotationen und beeinträchtigt negativ die Konvergenz des Modells, was wiederum zu geringerer Genauigkeit und instabiler Vorhersage führt. Um dieses Problem zu lösen, schlagen wir eine Self-adapTive Ambiguity Reduction (STAR)-Funktion vor, die die Eigenschaften der semantischen Unschärfheit nutzt. Wir stellen fest, dass die semantische Unschärfheit zu einer anisotropen Verteilung der Vorhersagen führt, was uns inspiriert hat, die Verteilung der Vorhersagen als Maß für die semantische Unschärfheit zu verwenden. Auf dieser Grundlage entwickeln wir den STAR-Verlust, der das Maß für die Anisotropie der Vorhersageverteilung berechnet. Im Vergleich zum Standardregressionsverlust wird der STAR-Verlust dann minimiert, wenn die Verteilung der Vorhersagen anisotrop ist, und damit adaptiv den Einfluss der semantischen Unschärfheit reduziert. Darüber hinaus schlagen wir zwei Arten von Eigenwertrestriktionsmethoden vor, die sowohl ungewöhnliche Veränderungen in der Verteilung als auch ein vorzeitiges Konvergieren des Modells vermeiden können. Schließlich zeigen umfassende Experimente, dass der STAR-Verlust auf drei Benchmarks – COFW, 300W und WFLW – den aktuellen Stand der Technik übertrifft und dabei nur einen vernachlässigbaren Rechenaufwand verursacht. Der Quellcode ist unter https://github.com/ZhenglinZhou/STAR verfügbar.