Korean Drama Scene Transcript Dataset für Emotionserkennung in Gesprächen
Die Erkennung von Emotionen in Gesprächen stellt eine herausfordernde Aufgabe dar, da Sätze oft eine implizite Bedeutung enthalten, die isoliert betrachtet nicht allgemein verständlich ist. Die effiziente Nutzung kontextueller Informationen ist entscheidend für die Emotionserkennung in Gesprächen. Viele veröffentlichte Datensätze liefern kontextuelle Informationen für Situationen wie textbasierte Online-Nachrichten, Chatbots und Filmdialoge. Allerdings werden solche dialogbasierten Datensätze durch die Auswahl idealer Gesprächssituationen erzeugt und enthalten daher nur wenige Variationen hinsichtlich der Gesprächslänge und der Anzahl der Teilnehmer. Daher sind solche Datensätze möglicherweise nicht geeignet für die Emotionserkennung in textbasierten Filmtranskripten, in denen Szenen unterschiedliche Anzahlen von Sprechern und variable Längen von Sprechpausen aufweisen. Wir präsentieren einen Gesprächsdatensatz, der auf Transkripten einer koreanischen Fernsehserie basiert, um Emotionen im Kontext von Szenen zu analysieren. Der Korean Drama Scene Transcript-Datensatz für die Emotionserkennung (KD-EmoR) ist ein textbasiertes Gesprächsdatenset. Wir analysieren drei Klassen komplexer Emotionen – Euphorie, Dysphorie und Neutralität – in Szenen einer Fernsehserie, um ein öffentlich zugängliches Datenset für zukünftige Forschung bereitzustellen. Zudem haben wir ein kontextbewusstes tiefes Lernmodell entwickelt, das Emotionen mithilfe von Sprecher- und Szenenkontext klassifiziert und auf dem vorgeschlagenen Datensatz einen F1-Score von 0,63 erzielt.