Die Emotion ist keine One-Hot-Codierung: Lernen mit Graustufen-Labels für die Emotionserkennung in Gesprächen

Bei der Emotionserkennung in Gesprächen (ERC) wird die Emotion einer aktuellen Äußerung anhand des vorherigen Kontexts vorhergesagt, was in zahlreichen Aufgaben des Natural Language Processing (NLP) genutzt werden kann. Obwohl in einer gegebenen Aussage mehrere Emotionen gleichzeitig auftreten können, gehen die meisten bisherigen Ansätze von einer Klassifikationsaufgabe aus und prognostizieren lediglich eine einzelne Etikettierung. Die Zuordnung einer Emotion zu einer Aussage mit hoher Zuverlässigkeit oder die Erstellung von Mehrfachetiketten ist jedoch aufwendig und schwierig. In diesem Paper konstruieren wir automatisch eine Graustufenetikettierung, die die Korrelation zwischen Emotionen berücksichtigt, und verwenden sie für das Lernen. Statt die gegebene Etikettierung als One-Hot-Codierung zu verwenden, erstellen wir eine Graustufenetikettierung, indem wir Bewertungen für verschiedene Emotionen messen. Wir stellen mehrere Methoden zur Erstellung von Graustufenetikettierungen vor und bestätigen, dass jede Methode die Leistung der Emotionserkennung verbessert. Unser Ansatz ist einfach, effektiv und universell anwendbar auf bestehende Systeme. Die Experimente zeigen eine signifikante Verbesserung der Leistung der Baseline-Modelle.