Gesichtsausdruckserkennung mittels Transfer Learning in tiefen CNN
Die Erkennung menschlicher Gesichtsausdrücke (Facial Emotion Recognition, FER) hat aufgrund ihrer vielversprechenden Anwendungen die Aufmerksamkeit der Forschungsgemeinschaft auf sich gezogen. Die Zuordnung verschiedener Gesichtsausdrücke zu den jeweiligen emotionalen Zuständen stellt die zentrale Aufgabe in der FER dar. Die klassische FER besteht aus zwei Hauptphasen: der Merkmalsextraktion und der Emotionserkennung. Derzeit wird insbesondere der tiefen neuronale Netzwerke, und speziell der Faltungsneuronalen Netze (Convolutional Neural Networks, CNN), aufgrund ihrer inhärenten Fähigkeit zur Merkmalsextraktion aus Bildern breit in der FER eingesetzt. Es wurden bereits mehrere Studien veröffentlicht, die CNNs mit nur wenigen Schichten zur Lösung von FER-Problemen nutzen. Allerdings besitzen herkömmliche flache CNNs mit einfachen Lernstrategien begrenzte Fähigkeiten zur Merkmalsextraktion und können Emotionsinformationen aus hochauflösenden Bildern nicht ausreichend erfassen.