HyperAIHyperAI
vor 18 Tagen

Ein leichtgewichtiges Modell zur Verbesserung der Gesichtsausdruckserkennung durch räumliche Bias- und Cosinus-Harmonie-Verlustfunktion

{Liangyu Huang, Xuefeng Chen}
Abstract

Diese Arbeit stellt ein neuartiges Netzwerk für die Gesichtsausdruckserkennung vor, das als Lightweight Facial Network with Spatial Bias (LFNSB) bezeichnet wird. Das LFNSB-Modell erreicht ein optimales Gleichgewicht zwischen Modellkomplexität und Erkennungsgenauigkeit. Es besteht aus zwei zentralen Komponenten: einem leichten Merkmalsextraktionsnetzwerk (LFN) und einem Spatial-Bias-(SB)-Modul zur Aggregation globaler Informationen. Das LFN integriert kombinierte Kanaloperationen und Depthwise-Konvolutionstechniken, wodurch die Anzahl der Parameter effektiv reduziert wird, gleichzeitig jedoch die Fähigkeit zur Merkmalsrepräsentation gesteigert wird. Das Spatial-Bias-Modul ermöglicht es dem Modell, sich sowohl auf lokale Gesichtsmerkmale zu konzentrieren als auch die Abhängigkeiten zwischen verschiedenen Gesichtsregionen zu erfassen. Zudem wurde eine neuartige Verlustfunktion namens Cosine-Harmony-Loss entwickelt. Diese Funktion optimiert die relativen Positionen von Merkmalsvektoren im hochdimensionalen Raum und führt zu einer verbesserten Merkmalsseparation und -clusterung. Experimentelle Ergebnisse auf den Datensätzen AffectNet und RAF-DB zeigen, dass das vorgeschlagene LFNSB-Modell hervorragende Leistungen bei der Gesichtsausdrucksanalyse erzielt. Es erreicht eine hohe Erkennungsgenauigkeit, während die Anzahl der Parameter erheblich reduziert wird, was die Modellkomplexität signifikant senkt.