Wissensbasierte Transformer für die Emotionsdetektion in textbasierten Gesprächen

Nachrichten im menschlichen Gespräch vermitteln inhärent Emotionen. Die Aufgabe der Emotionsdetektion in textbasierten Gesprächen führt zu einer Vielzahl von Anwendungen, beispielsweise der Meinungsanalyse in sozialen Netzwerken. Die Fähigkeit von Maschinen, Emotionen in Gesprächen zu analysieren, ist jedoch herausfordernd, da Menschen oft auf Kontext und Alltagswissen angewiesen sind, um Emotionen auszudrücken. In diesem Artikel greifen wir diese Herausforderungen an, indem wir einen knowledge-enriched Transformer (KET) vorschlagen, bei dem kontextuelle Äußerungen mittels hierarchischer Selbst-Attention interpretiert werden und externes Alltagswissen dynamisch mithilfe eines kontextbewussten affektiven Graph-Attention-Mechanismus genutzt wird. Experimente an mehreren textbasierten Gesprächsdatensätzen zeigen, dass sowohl Kontext als auch Alltagswissen konsistent zur Verbesserung der Emotionsdetektionsleistung beitragen. Zudem erzielt unser KET-Modell auf den meisten der getesteten Datensätze eine bessere F1-Score-Leistung als die derzeitigen State-of-the-Art-Modelle.