Facial Motion Prior Netzwerke für die Erkennung von Gesichtsausdrücken

Die auf tiefem Lernen basierende Erkennung von Gesichtsausdrücken (Facial Expression Recognition, FER) hat in den letzten Jahren viel Aufmerksamkeit erhalten. Die meisten existierenden FER-Methoden, die auf tiefem Lernen basieren, berücksichtigen Domänenwissen jedoch nicht ausreichend und scheitern daher daran, repräsentative Merkmale zu extrahieren. In dieser Arbeit schlagen wir ein neues FER-Framework vor, das als Facial Motion Prior Networks (FMPN) bezeichnet wird. Insbesondere führen wir einen zusätzlichen Ast ein, um eine Gesichtsmaske zu generieren, die sich auf die Regionen bewegter Gesichtsmuskeln konzentriert. Um das Lernen der Gesichtsmaske zu steuern, schlagen wir vor, durch die Verwendung der durchschnittlichen Unterschiede zwischen neutralen und den entsprechenden ausdrucksstarken Gesichtern als Trainingsleitfaden vorangegangenes Domänenwissen einzubeziehen. Ausführliche Experimente mit drei Benchmark-Datensätzen für Gesichtsausdrücke zeigen die Effektivität des vorgeschlagenen Verfahrens im Vergleich zu den bislang besten Ansätzen.