Command Palette
Search for a command to run...
MixAugment & Mixup: Augmentationsmethoden für die Gesichtsausdruckserkennung
MixAugment & Mixup: Augmentationsmethoden für die Gesichtsausdruckserkennung
Andreas Psaroudakis Dimitrios Kollias
Zusammenfassung
Die automatische Erkennung von Gesichtsausdrücken (Automatic Facial Expression Recognition, FER) hat in den letzten 20 Jahren zunehmend an Aufmerksamkeit gewonnen, da Gesichtsausdrücke eine zentrale Rolle in der menschlichen Kommunikation spielen. Die meisten FER-Methoden setzen tiefgehende neuronale Netze (Deep Neural Networks, DNNs) ein, die leistungsfähige Werkzeuge zur Datenanalyse darstellen. Dennoch sind diese Netzwerke aufgrund ihrer Neigung, die Trainingsdaten zu memorieren, anfällig für Überanpassung (Overfitting). Zudem existieren derzeit nur wenige große Datensätze für FER, die in natürlichen Umgebungen (in-the-wild) erfasst wurden, d. h. unter unbeschränkten Bedingungen. Um dieses Problem zu mildern, wurden verschiedene Techniken zur Datenaugmentation vorgeschlagen. Datenaugmentation ermöglicht es, die Vielfalt verfügbarer Daten durch beschränkte Transformationen an den ursprünglichen Daten zu erhöhen. Eine solche Technik, die sich in zahlreichen Klassifizierungsaufgaben positiv ausgewirkt hat, ist Mixup. Dabei wird ein DNN auf konvexen Kombinationen von Paaren von Beispielen und deren entsprechenden Labels trainiert. In dieser Arbeit untersuchen wir die Wirksamkeit von Mixup für die FER in natürlichen Umgebungen, bei denen große Variationen in Kopfpositionen, Beleuchtungsbedingungen, Hintergründen und Kontexten vorliegen. Anschließend stellen wir eine neue Strategie zur Datenaugmentation vor, die auf Mixup basiert und MixAugment genannt wird. Dabei wird das Netzwerk gleichzeitig auf einer Kombination aus virtuellen und realen Beispielen trainiert; alle diese Beispiele tragen zur Gesamtverlustfunktion bei. Wir führen eine umfassende experimentelle Studie durch, die die Überlegenheit von MixAugment gegenüber Mixup und verschiedenen state-of-the-art-Methoden belegt. Zudem untersuchen wir die Kombination von Dropout mit Mixup und MixAugment sowie die Kombination weiterer Techniken zur Datenaugmentation mit MixAugment.