DeXpression: Tiefes Faltungsneuronales Netzwerk für die Erkennung von Ausdrucksmerkmalen

Wir schlagen eine Architektur eines Faltungsneuralen Netzes (CNN) für die Erkennung von Gesichtsausdrücken vor. Die vorgeschlagene Architektur ist unabhängig von manuell erstellten Merkmalsextraktionen und erzielt bessere Ergebnisse als frühere Ansätze, die auf Faltungsneuralen Netzen basieren. Wir visualisieren die automatisch extrahierten Merkmale, die vom Netzwerk gelernt wurden, um ein tieferes Verständnis zu ermöglichen. Für die quantitative Bewertung werden die Standarddatensätze, nämlich der erweiterte Cohn-Kanade-Datensatz (CKP) und die MMI-Gesichtsausdruck-Datenbank verwendet. Auf dem CKP-Datensatz erreicht der aktuelle Stand der Technik, der CNNs nutzt, eine Genauigkeit von 99,2 %. Für den MMI-Datensatz beträgt die aktuell beste Genauigkeit für Emotionserkennung 93,33 %. Die vorgeschlagene Architektur erreicht 99,6 % für CKP und 98,63 % für MMI und übertrifft damit den aktuellen Stand der Technik bei der Verwendung von CNNs. Automatische Gesichtsausdruckserkennung hat eine breite Anwendungsspektrum in Bereichen wie Mensch-Computer-Interaktion und Sicherheitssystemen. Dies liegt daran, dass nichtverbale Signale wichtige Formen der Kommunikation sind und in interpersonellen Beziehungen eine zentrale Rolle spielen. Die Leistung der vorgeschlagenen Architektur bestätigt die Effizienz und verlässliche Anwendbarkeit des vorgeschlagenen Verfahrens in realen Anwendungsfällen.