HyperAIHyperAI
vor 18 Tagen

Ein neuartiges Modell zur Gesichtsausdruckserkennung basierend auf der Segmentierung mit VGG-19-Architektur

{Rajeswari Sridhar, M. Sridevi, M. Savithadevi, S. Vignesh}
Abstract

Die Erkennung von Gesichtsausdrücken (Facial Emotion Recognition, FER) hat in den letzten Jahren an Beliebtheit gewonnen, da sie eine Vielzahl von Anwendungen ermöglicht, darunter Biometrie, die Erkennung psychischer Erkrankungen, das Verständnis menschlichen Verhaltens sowie psychologische Profilierung. Dennoch bleibt die Entwicklung eines genauen und robusten FER-Pipelines weiterhin herausfordernd, da mehrere Faktoren die Verallgemeinerbarkeit über verschiedene Emotionen hinweg erschweren. Zu den Herausforderungen, die eine vielversprechende FER-Pipeline beeinträchtigen, gehören Posevariationen, die Heterogenität der Gesichtsstruktur, Beleuchtungsbedingungen, Verdeckung, geringe Auflösung sowie altersbedingte Veränderungen. Um diese Probleme zu überwinden, wurden zahlreiche Ansätze entwickelt, beispielsweise der Histogram of Oriented Gradients (HOG) und die Histogramm-Darstellung des Local Binary Pattern (LBP). Diese Methoden erfordern jedoch eine manuelle Merkmalsauswahl. Convolutional Neural Networks (CNN) haben dieses Problem der manuellen Merkmalsauswahl überwunden. Durch ihre einzigartige Strategie zur Merkmalsextraktion zeigen CNN großes Potenzial bei FER-Aufgaben im Vergleich zu herkömmlichen FER-Modellen. In diesem Artikel stellen wir eine neuartige CNN-Architektur vor, bei der Segmentationsschichten aus der U-Net-Struktur zwischen die Visual Geometry Group (VGG)-Schichten integriert werden. Dadurch kann das Netzwerk kritischere Merkmale aus dem Merkmalsraum stärker hervorheben und gleichzeitig den Fluss redundanter Informationen durch die VGG-Schichten kontrollieren. Unser Modell erreicht eine state-of-the-art (SOTA)-Genauigkeit als Einzelnetz im Vergleich zu anderen bekannten FER-Modellen auf dem FER-2013-Datensatz.

Ein neuartiges Modell zur Gesichtsausdruckserkennung basierend auf der Segmentierung mit VGG-19-Architektur | Neueste Forschungsarbeiten | HyperAI