EmoWOZ: Ein großskaliges Korpus und ein Labeling-Schema zur Emotionserkennung in aufgabenorientierten Dialogsystemen

Die Fähigkeit, Emotionen zu erkennen, verleiht einer conversationalen künstlichen Intelligenz eine menschliche Note. Während Emotionen in informellen Chit-Chat-Dialogen erhebliche Aufmerksamkeit erhalten haben, bleiben Emotionen in aufgabenorientierten Dialogen weitgehend unberücksichtigt. Dies ist erstaunlich, da Emotionen und Dialogerfolg in einem natürlichen System gleichermaßen wichtige Rollen spielen. Bestehende emotionen-annotierte Korpora für aufgabenorientierte Dialoge sind aufgrund ihrer geringen Größe, der eingeschränkten Vielfalt an Etiketten und der geringen öffentlichen Verfügbarkeit aufgrund von Engpässen für nachgeschaltete Aufgaben begrenzt. Um eine Grundlage für die Erforschung von Emotionen in aufgabenorientierten Dialogen zu schaffen, stellen wir EmoWOZ vor – ein großskaliges, manuell emotionen-annotiertes Korpus aufgabenorientierter Dialoge. EmoWOZ basiert auf MultiWOZ, einem mehrdomänenorientierten, aufgabenorientierten Dialogdatensatz. Es umfasst über 11.000 Dialoge mit mehr als 83.000 Emotionen-Anmerkungen für Benutzeräußerungen. Neben den Wizard-of-Oz-Dialogen aus MultiWOZ haben wir zusätzlich Mensch-Maschine-Dialoge innerhalb derselben Domänen erfasst, um den Raum verschiedener Emotionen, die im Laufe der Lebensdauer eines datengesteuerten Dialogsystems auftreten können, hinreichend abzudecken. Soweit uns bekannt ist, handelt es sich hierbei um das erste großskalige, quelloffene Korpus dieser Art. Wir schlagen ein neuartiges Emotionen-Labeling-Schema vor, das speziell auf aufgabenorientierte Dialoge zugeschnitten ist. Wir präsentieren eine Reihe experimenteller Ergebnisse, die die Brauchbarkeit dieses Korpus für die Emotionserkennung und Zustandsverfolgung in aufgabenorientierten Dialogen belegen.