Supervisierte prototypische kontrastive Lernmethodik für die Emotionserkennung in Gesprächen

Die Erfassung von Emotionen innerhalb einer Konversation spielt eine entscheidende Rolle in modernen Dialogsystemen. Allerdings stellen die schwache Korrelation zwischen Emotionen und Semantik zahlreiche Herausforderungen für die Emotionserkennung in Gesprächen (ERC) dar. Selbst semantisch ähnliche Äußerungen können je nach Kontext oder Sprecher stark unterschiedliche Emotionen ausdrücken. In diesem Paper stellen wir eine Supervised Prototypical Contrastive Learning (SPCL)-Verlustfunktion für die ERC-Aufgabe vor. Ausgehend von dem Prototypical Network zielt die SPCL darauf ab, das Problem der unbalancierten Klassifikation durch kontrastives Lernen zu lösen, ohne eine große Batch-Größe zu erfordern. Gleichzeitig entwickeln wir eine Schwierigkeitsmaßfunktion basierend auf dem Abstand zwischen Klassen und integrieren Curriculum-Learning, um die Auswirkungen extrem schwieriger Beispiele zu mildern. Wir erreichen state-of-the-art-Ergebnisse auf drei weit verbreiteten Benchmarks. Zudem führen wir analytische Experimente durch, um die Wirksamkeit unserer vorgeschlagenen SPCL-Verlustfunktion und des Curriculum-Learning-Ansatzes zu belegen. Den Quellcode stellen wir unter https://github.com/caskcsg/SPCL zur Verfügung.