HyperAIHyperAI
vor 2 Monaten

Kovarianz-Pooling für die Erkennung von Gesichtsausdrücken

Dinesh Acharya; Zhiwu Huang; Danda Paudel; Luc Van Gool
Kovarianz-Pooling für die Erkennung von Gesichtsausdrücken
Abstract

Die Klassifizierung von Gesichtsausdrücken in verschiedene Kategorien erfordert die Erfassung regionaler Verzerrungen der Gesichtslandmarks. Wir sind der Überzeugung, dass zweite Ordnungsstatistiken wie die Kovarianz besser in der Lage sind, solche Verzerrungen in regionalen Gesichtseigenschaften zu erfassen. In dieser Arbeit untersuchen wir die Vorteile der Verwendung einer Mannigfaltigkeitsnetzstruktur für die Kovarianz-Pooling, um die Erkennung von Gesichtsausdrücken zu verbessern. Insbesondere verwenden wir erstmals solche Art von Mannigfaltigkeitsnetzen in Kombination mit traditionellen Faltungsnetzen zur räumlichen Pooling innerhalb einzelner Bildmerkmalskarten in einem end-to-end tiefen Lernansatz. Auf diese Weise erreichen wir eine Erkennungsgenauigkeit von 58,14 % im Validierungsdatensatz von Static Facial Expressions in the Wild (SFEW 2.0) und 87,0 % im Validierungsdatensatz der Real-World Affective Faces (RAF)-Datenbank. Beide Ergebnisse sind die besten, von denen wir wissen. Darüber hinaus nutzen wir das Kovarianz-Pooling, um die zeitliche Entwicklung pro-Rahmen-Merkmale für videobasierte Gesichtsausdruckserkennung zu erfassen. Unsere gemeldeten Ergebnisse zeigen den Vorteil des zeitlichen Poolings von Bildsatz-Merkmale durch das Anordnen des entwickelten Mannigfaltigkeitsnetzes für Kovarianz-Pooling über den Schichten der Faltungsnetze.请注意,这里有一些小的调整以适应德语的语法和表达习惯,同时保持了原文的专业性和准确性。例如,“end-to-end deep learning manner”被翻译为“end-to-end tiefen Lernansatz”,这是为了符合德语中复合名词的使用习惯。“pro-Rahmen-Merkmale”是为了更清晰地表达“per-frame features”。此外,“Bildsatz-Merkmale”(图像集特征)是为了更好地传达“image-set features”的含义。