HyperAIHyperAI
vor 18 Tagen

Facial Expression Recognition in the Wild via Deep Attentive Center Loss

{Xiaojun Qi, Amir Hossein Farzaneh}
Facial Expression Recognition in the Wild via Deep Attentive Center Loss
Abstract

Die Lernung diskriminativer Merkmale für die Gesichtsausdruckserkennung (Facial Expression Recognition, FER) in natürlicher Umgebung („in the wild“) mittels konvolutioneller Neuraler Netze (Convolutional Neural Networks, CNNs) stellt aufgrund erheblicher intra-klassischer Variabilität und inter-klassischer Ähnlichkeiten eine anspruchsvolle Aufgabe dar. Deep Metric Learning (DML)-Ansätze wie die Center-Loss und deren Varianten, die gemeinsam mit der Softmax-Loss-Funktion optimiert werden, werden in zahlreichen FER-Methoden eingesetzt, um die Diskriminativkraft der gelernten Merkmale im Embedding-Raum zu verstärken. Allerdings kann die gleichmäßige Supervision aller Merkmale mittels Metric Learning irrelevante Merkmalskomponenten einbeziehen und letztlich die Generalisierungsfähigkeit des Lernalgorithmus verschlechtern. Wir schlagen eine Deep Attentive Center Loss (DACL)-Methode vor, die adaptiv eine Teilmenge bedeutungsvoller Merkmalskomponenten zur Verbesserung der Diskriminierung auswählt. Die vorgeschlagene DACL integriert eine Aufmerksamkeitsmechanik, um Aufmerksamkeitsgewichte zu schätzen, die mit der Bedeutung der Merkmale korrelieren, wobei die intermediären räumlichen Merkmalskarten des CNN als Kontext dienen. Die geschätzten Gewichte ermöglichen eine spärliche Formulierung der Center-Loss, um selektiv intra-klassische Kompaktheit und inter-klassische Trennschärfe für relevante Informationen im Embedding-Raum zu erreichen. Eine umfassende Studie an zwei weit verbreiteten FER-Datensätzen aus natürlicher Umgebung belegt die Überlegenheit der vorgeschlagenen DACL-Methode gegenüber aktuellen State-of-the-Art-Verfahren.