Command Palette
Search for a command to run...
Statische und dynamische Sprechermodellierung basierend auf Graph Neural Networks für die Emotionserkennung in Gesprächen
Statische und dynamische Sprechermodellierung basierend auf Graph Neural Networks für die Emotionserkennung in Gesprächen
Sadao Kurohashi Yin Jou Huang Prakhar Saxena
Zusammenfassung
Jeder Mensch verfügt über eine einzigartige Persönlichkeit, die beeinflusst, wie er Emotionen empfindet und ausdrückt. Daher ist die Sprechermodellierung für die Aufgabe der Emotionserkennung in Gesprächen (Emotion Recognition in Conversation, ERC) von großer Bedeutung. In diesem Paper stellen wir ein neuartiges, graphenbasiertes ERC-Modell vor, das sowohl den Gesprächskontext als auch die Sprecherpersönlichkeit berücksichtigt. Wir modellieren den inneren Zustand des Sprechers (Persönlichkeit) als statischen und dynamischen Sprecherzustand, wobei der dynamische Sprecherzustand mittels eines graphenbasierten neuronalen Netzwerks (Graph Neural Network, GNN) als Encoder modelliert wird. Experimente auf Benchmark-Datensätzen belegen die Wirksamkeit unseres Modells. Unser Ansatz übertrifft sowohl die Baseline-Methoden als auch andere graphenbasierte Ansätze. Die Analyse der Ergebnisse unterstreicht zudem die Bedeutung einer expliziten Sprechermodellierung.