HyperAIHyperAI
vor 11 Tagen

HiTrans: Ein auf Transformer basierendes kontext- und sprecherempfindliches Modell zur Emotionsdetektion in Gesprächen

{Yijiang Liu, Meishan Zhang, Fei Li, Donghong Ji, Jingye Li}
HiTrans: Ein auf Transformer basierendes kontext- und sprecherempfindliches Modell zur Emotionsdetektion in Gesprächen
Abstract

Die Erkennung von Emotionen in Gesprächen (Emotion Detection in Conversations, EDC) zielt darauf ab, für jede Äußerung in Gesprächen mit mehreren Sprechern die zugrundeliegende Emotion zu identifizieren. Im Gegensatz zur traditionellen, nicht konversationalen Emotionserkennung muss ein EDC-Modell kontextsensitiv (z. B. die gesamte Gesprächsstruktur verstehen statt nur einzelne Äußerungen) und sprachersensitiv (z. B. erkennen, welcher Sprecher welcher Äußerung zuzuordnen ist) sein. In diesem Artikel stellen wir ein auf Transformers basierendes, kontext- und sprachersensitives Modell für EDC vor, namens HiTrans, das aus zwei hierarchischen Transformers besteht. Wir nutzen BERT als niedrigstufigen Transformer, um lokale Äußerungsrepräsentationen zu generieren, die anschließend in einen weiteren, hochstufigen Transformer eingespeist werden, um sicherzustellen, dass die Äußerungsrepräsentationen sensibel gegenüber dem globalen Kontext des Gesprächs sind. Zudem führen wir eine Hilfsaufgabe ein, um die Sprachersensitivität unseres Modells zu gewährleisten: die Paarweise Äußerungs-Sprecher-Verifizierung (Pairwise Utterance Speaker Verification, PUSV), die darauf abzielt, zu klassifizieren, ob zwei Äußerungen denselben Sprecher haben. Wir evaluieren unser Modell an drei etablierten Benchmark-Datensätzen: EmoryNLP, MELD und IEMOCAP. Die Ergebnisse zeigen, dass unser Modell die bisherigen State-of-the-Art-Modelle übertrifft.

HiTrans: Ein auf Transformer basierendes kontext- und sprecherempfindliches Modell zur Emotionsdetektion in Gesprächen | Neueste Forschungsarbeiten | HyperAI