HyperAIHyperAI

Command Palette

Search for a command to run...

vor 4 Monaten

Ein Dual-Directional-Attention-Mischfeature-Netzwerk für die Gesichtsausdrucks Erkennung

{Zhigang Song YuFei Wang Ye Zhang Yuhang Zhang Saining Zhang}

Abstract

In den letzten Jahren hat die Gesichtsausdruckserkennung (Facial Expression Recognition, FER) erhebliche Aufmerksamkeit innerhalb der Forschung im Bereich des Computersehens erfahren. In diesem Beitrag wird ein innovatives Netzwerk namens Dual-Direction Attention Mixed Feature Network (DDAMFN) vorgestellt, das speziell für die FER entwickelt wurde und sowohl Robustheit als auch geringen Ressourcenverbrauch aufweist. Die Netzarchitektur besteht aus zwei Hauptkomponenten: dem Mixed Feature Network (MFN), das als Backbone dient, und dem Dual-Direction Attention Network (DDAN), das als Head fungiert. Um die Fähigkeiten des MFN zu verbessern, werden resiliente Merkmale durch den Einsatz von Kernen unterschiedlicher Größe extrahiert. Zudem wird ein neues Dual-Direction Attention (DDA)-Head vorgeschlagen, das Aufmerksamkeitskarten in zwei Orientierungen generiert, wodurch das Modell in der Lage ist, langreichweitige Abhängigkeiten effektiv zu erfassen. Um die Genauigkeit weiter zu steigern, wird eine neuartige Aufmerksamkeitsverlustfunktion für den DDAN eingeführt, bei der verschiedene Heads sich auf unterschiedliche Bereiche der Eingabe konzentrieren. Experimentelle Bewertungen an mehreren etablierten öffentlichen Datensätzen, darunter AffectNet, RAF-DB und FERPlus, belegen die Überlegenheit des DDAMFN gegenüber anderen bestehenden Modellen und etablieren das DDAMFN als das derzeit fortschrittlichste Modell im Bereich der FER.

Benchmarks

BenchmarkMethodikMetriken
facial-expression-recognition-on-affectnetDDAMFN
Accuracy (7 emotion): 67.03
Accuracy (8 emotion): 64.25
facial-expression-recognition-on-affectnetDDAMFN++
Accuracy (7 emotion): 67.36
Accuracy (8 emotion): 65.04
facial-expression-recognition-on-fer-1DDAMFN
Accuracy: 90.74
facial-expression-recognition-on-raf-dbDDAMFN++
Overall Accuracy: 92.34
facial-expression-recognition-on-raf-dbDDAMFN
Overall Accuracy: 91.35

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Ein Dual-Directional-Attention-Mischfeature-Netzwerk für die Gesichtsausdrucks Erkennung | Forschungsarbeiten | HyperAI