MPEG: Ein mehrperspektivisch verbessertes Graph-Attention-Netzwerk für kausale Emotionsfolgerung in Gesprächen
Emotionale Ursachen bilden eine zentrale Komponente für das Verständnis emotionaler Gespräche. Kürzlich wurde eine neue Aufgabe namens kausale Emotionsimplikation (Causal Emotion Entailment, CEE) vorgeschlagen, um die kausalen Äußerungen für eine Ziel-Emotionsäußerung innerhalb eines Gesprächs zu identifizieren. Obwohl Forscher bei der Lösung dieses Problems bereits einige Fortschritte erzielt haben, wurde bisher unzureichend auf die sprachlichen Merkmale der Sprecher eingegangen und die Auswirkungen zeitlicher Beziehungen in Gesprächsstrukturen übersehen. Um diese Forschungslücke teilweise zu schließen, stellen wir einen neuen Ansatz zur kausalen Emotionsimplikation vor, namens MPEG (Multi-Perspective Enhanced Graph Attention Network). Die Ausbildung von MPEG erfolgt in drei Phasen. Zunächst nutzen wir ein sprecherbewusstes vortrainiertes Modell sowie zwei Aufmerksamkeitsmechanismen, um Äußerungsrepräsentationen zu erzeugen, die sowohl lokale Kontextinformationen als auch sprachliche und emotionale Merkmale integrieren. Anschließend werden diese Repräsentationen in ein Graph-Attention-Netzwerk eingespeist, um die Gesprächsstrukturen und emotionale Dynamik sowohl lokal als auch global zu modellieren. Schließlich wird ein vollständig verbundenes Netzwerk implementiert, um die Beziehungen zwischen emotionalen Äußerungen und kausalen Äußerungen vorherzusagen. Experimentelle Ergebnisse zeigen, dass MPEG eine state-of-the-art-Leistung erzielt.