Emotionserkennung im Kontext von Gesprächen als Sequenzmarkierung
{Jing Xiao Shaojun Wang Jun Ma Jiayu Zhang Yan Wang}

Abstract
Die Erkennung von Emotionen in Gesprächen (ERC) ist ein zentrales Thema für die Entwicklung empathischer Maschinen in verschiedenen Bereichen wie der sozialen Meinungserhebung, der Gesundheitsversorgung und anderen. In diesem Artikel stellen wir eine Methode vor, bei der die ERC-Aufgabe als Sequenzmarkierung modelliert wird, wobei eine Conditional Random Field (CRF)-Schicht eingesetzt wird, um die emotionale Konsistenz im Gespräch zu lernen. Wir verwenden LSTM-basierte Encoder, die sowohl die Selbst- als auch die Inter-Sprecher-Abhängigkeiten der Gesprächspartner erfassen, um kontextualisierte Äußerungsrepräsentationen zu generieren, die dann der CRF-Schicht zugeführt werden. Um langreichweitige globale Kontextinformationen zu erfassen, ergänzen wir den LSTM-basierten Encoder durch einen mehrschichtigen Transformer-Encoder. Experimente zeigen, dass unsere Methode von der Modellierung der emotionalen Konsistenz profitiert und auf mehreren Datensätzen zur Emotionsklassifizierung die derzeitigen State-of-the-Art-Methoden übertrifft.
Benchmarks
| Benchmark | Methodik | Metriken |
|---|---|---|
| emotion-recognition-in-conversation-on | CESTa | Weighted-F1: 67.1 |
| emotion-recognition-in-conversation-on-3 | CESTa | Micro-F1: 63.12 |
| emotion-recognition-in-conversation-on-meld | CESTa | Weighted-F1: 58.36 |
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.