EmotionIC : modélisation de la dépendance pilotée par l'inertie émotionnelle et la contagion pour la reconnaissance des émotions dans les conversations

La reconnaissance des émotions dans les conversations (ERC) a suscité un intérêt croissant ces dernières années en raison des progrès et de la mise en œuvre des technologies d'interfaces homme-machine. Dans cet article, nous proposons une approche de modélisation des dépendances pilotée par l'inertie émotionnelle et la contagion émotionnelle (EmotionIC) pour la tâche d'ERC. Notre modèle EmotionIC se compose de trois composants principaux : l'attention à tête multiple masquée par l'identité (IMMHA), l'unité récurrente à seuil basée sur la conversation (DiaGRU), et le champ aléatoire conditionnel en chaîne sautante (SkipCRF). Contrairement aux modèles précédents d'ERC, EmotionIC permet une modélisation plus complète d'une conversation, tant au niveau de l'extraction de caractéristiques que de la classification. Le modèle proposé vise à intégrer les avantages des méthodes basées sur l'attention et celles basées sur la récurrence au niveau de l'extraction de caractéristiques. Plus précisément, l'IMMHA est utilisée pour capturer les dépendances contextuelles globales fondées sur l'identité, tandis que la DiaGRU permet d'extraire des informations contextuelles locales sensibles au locuteur et au temps. Au niveau de la classification, le SkipCRF permet d'extraire explicitement des flux émotionnels complexes à partir des utterances voisines d'ordre supérieur dans la conversation. Les résultats expérimentaux montrent que notre méthode surpasse significativement les modèles de pointe sur quatre jeux de données de référence. Les études d'ablation confirment que nos modules permettent efficacement de modéliser l'inertie émotionnelle et la contagion émotionnelle.