Apprentissage contrastif prototypique supervisé pour la reconnaissance des émotions dans les conversations

Capturer les émotions au sein d’une conversation joue un rôle essentiel dans les systèmes de dialogue modernes. Toutefois, la faible corrélation entre les émotions et les significations sémantiques pose de nombreux défis pour la reconnaissance des émotions dans les conversations (ERC). Même des énoncés sémantiquement similaires peuvent exprimer des émotions très différentes selon le contexte ou le locuteur. Dans cet article, nous proposons une fonction de perte, nommée Apprentissage Contraste par Prototypes Supervisé (SPCL), pour la tâche d’ERC. En s’appuyant sur le modèle des Réseaux de Prototypes, la SPCL vise à résoudre le problème de classification déséquilibrée grâce à un apprentissage contrastif, sans nécessiter de grands tailles de lot. Par ailleurs, nous avons conçu une fonction de mesure de difficulté fondée sur la distance entre les classes, et intégré l’apprentissage progressif (curriculum learning) afin de réduire l’impact des échantillons extrêmes. Nos expériences montrent que notre méthode atteint des résultats de pointe sur trois benchmarks largement utilisés. En outre, nous avons mené des expériences analytiques pour démontrer l’efficacité de la SPCL ainsi que de la stratégie d’apprentissage progressif proposées. Le code source est disponible à l’adresse suivante : https://github.com/caskcsg/SPCL.