InstructERC : Réforme de la Reconnaissance des Émotions dans les Conversations avec des Modèles Linguistiques de Grande Taille Augmentés par la Récupération Multitâche

Le domaine de la reconnaissance des émotions dans les conversations (ERC) s'est principalement concentré sur la séparation de l'encodage des caractéristiques des phrases et du modélisation du contexte, manquant d'exploration dans les paradigmes génératifs basés sur des conceptions unifiées. Dans cette étude, nous proposons une nouvelle approche, InstructERC, visant à reformuler la tâche ERC d'un cadre discriminatif à un cadre génératif basé sur des grands modèles linguistiques (LLMs). InstructERC apporte trois contributions significatives : (1) il introduit un module de modèle de récupération simple mais efficace, qui aide le modèle à intégrer explicitement des informations de supervision dialogique à plusieurs niveaux de granularité. (2) Nous introduisons deux tâches supplémentaires d'alignement émotionnel, à savoir l'identification du locuteur et la prédiction des émotions, pour modéliser implicitement les relations de rôle dans le dialogue et les tendances émotionnelles futures dans les conversations. (3) De manière pionnière, nous unifions les étiquettes émotionnelles entre les différents jeux de données de référence grâce au cercle des sentiments afin de mieux correspondre aux scénarios d'application réels. InstructERC continue d'afficher des performances impressionnantes sur ce jeu de données unifié. Notre cadre de plugin basé sur LLM dépasse considérablement tous les modèles précédents et atteint l'état de l'art global sur trois jeux de données ERC couramment utilisés. Une analyse approfondie d'expériences paramétriques efficaces et d'échelle des données fournit une orientation empirique pour son application dans des scénarios pratiques.