Apprentissage par transfert conversationnel pour la reconnaissance des émotions

La reconnaissance des émotions dans les conversations constitue une tâche difficile en raison des dépendances contextuelles régies par des influences intrapersonnelles et interpersonnelles. Les approches récentes se sont principalement concentrées sur la modélisation de ces dépendances à l’aide d’apprentissage supervisé. Toutefois, les stratégies fondées uniquement sur l’apprentissage supervisé nécessitent de grandes quantités de données annotées, qui sont souvent absentes dans la plupart des corpus disponibles pour cette tâche. Pour relever ce défi, nous explorons les approches d’apprentissage par transfert comme alternative viable. Étant donné la grande quantité de données conversationnelles disponibles, nous étudions la possibilité d’exploiter des modèles conversationnels génératifs afin de transférer des connaissances affectives pour la détection des émotions dans un contexte donné. Nous proposons une approche, TL-ERC, dans laquelle un modèle hiérarchique de dialogue est pré-entraîné sur des conversations multi-tours (source), puis ses paramètres sont transférés vers un classificateur d’émotions conversationnelles (cible). En plus de la pratique courante d’utilisation d’encodeurs de phrases pré-entraînés, notre méthode intègre également des paramètres récurrents capables de modéliser le contexte inter-sententiel à travers l’ensemble de la conversation. À partir de cette idée, nous menons plusieurs expériences sur divers jeux de données et observons une amélioration de la performance ainsi qu’une robustesse accrue face à un volume limité de données d’entraînement. TL-ERC atteint également de meilleures performances sur les données de validation en un nombre significativement réduit d’époques. Globalement, nous concluons que les connaissances acquises à partir de générateurs de dialogues peuvent effectivement contribuer à la reconnaissance des émotions dans les conversations.