Mini-ResEmoteNet: Wissensdistillierung für humanzentriertes Design

Die Erkennung von Gesichtsausdrucksemotionen (Facial Emotion Recognition) hat sich zunehmend als entscheidend im Bereich der Benutzererfahrung (User Experience) erwiesen, insbesondere in modernen Nutzbarkeitstests, da sie ein tieferes Verständnis von Benutzersatisfaction und -bindung ermöglicht. Diese Studie strebt an, das ResEmoteNet-Modell durch die Anwendung eines Wissensdistillationsrahmens zu erweitern, um Mini-ResEmoteNet-Modelle – leichte Schülermodelle – für Nutzbarkeitstests zu entwickeln. Experimente wurden auf den Datensätzen FER2013 und RAF-DB durchgeführt, um die Effektivität dreier Schülermodellarchitekturen zu bewerten: Schülermodell A, Schülermodell B und Schülermodell C. Ihre Entwicklung beinhaltet eine Reduzierung der Anzahl der Merkmalskanäle in jeder Schicht des Lehrermodells um etwa 50 %, 75 % und 87,5 %. Das Schülermodell A (E1) zeigte eine außergewöhnliche Leistung auf dem FER2013-Datensatz und erreichte eine Testgenauigkeit von 76,33 %, was eine absolute Verbesserung von 0,21 % gegenüber EmoNeXt darstellt. Darüber hinaus zeigen die Ergebnisse absolute Verbesserungen in Bezug auf Inferenzgeschwindigkeit und Speicherverbrauch während der Inferenz im Vergleich zum ResEmoteNet-Modell. Die Ergebnisse deuten darauf hin, dass die vorgeschlagenen Methoden andere Standesder-Kunst-Ansätze übertrumpfen.