Représentations d’énoncés à embarquement dépendant du contexte pour la reconnaissance des émotions dans les conversations

La reconnaissance des émotions dans les conversations (ERC) gagne en importance croissante à mesure que les agents conversationnels deviennent de plus en plus répandus. Reconnaître les émotions est essentiel pour une communication efficace et constitue un élément clé dans le développement d’agents conversationnels performants et empathiques. Une connaissance approfondie du contexte conversationnel est extrêmement précieuse pour identifier les émotions des interlocuteurs. Nous abordons donc la reconnaissance des émotions dans les conversations en exploitant pleinement le contexte conversationnel, c’est-à-dire en tenant compte des échanges antérieurs. La méthode classique pour modéliser le contexte conversationnel consiste à produire des représentations indépendantes du contexte pour chaque énoncé, puis à appliquer une modélisation contextuelle à ces représentations. Dans cette étude, nous proposons d’obtenir des représentations d’embeddings dépendantes du contexte pour chaque énoncé, en tirant parti du pouvoir représentationnel des modèles pré-entraînés de type transformateur. Dans notre approche, nous fournissons au encodeur RoBERTa l’énoncé à classifier, auquel est ajouté le contexte conversationnel précédent. Un module de classification simple est ensuite ajouté au modèle, ce qui permet d’éliminer la nécessité de traiter le contexte séparément après l’extraction des embeddings, puisque ces derniers encapsulent déjà une représentation efficace du contexte. Nous étudions également l’impact du nombre de tours conversationnels introduits sur la performance de notre modèle. L’efficacité de notre méthode est validée sur le jeu de données DailyDialog à domaine ouvert ainsi que sur le jeu de données EmoWOZ orienté vers des tâches spécifiques.