MPEG : Un réseau d'attention sur graphe à amélioration multi-perspective pour l'inférence émotionnelle causale dans les conversations
Les causes émotionnelles constituent une composante essentielle à la compréhension des conversations émotionnelles. Récemment, une nouvelle tâche, nommée Entailment causal émotionnel (CEE), a été proposée afin d’identifier les énoncés causaux associés à un énoncé émotionnel cible au sein d’une conversation. Bien que les chercheurs aient obtenu certains progrès dans la résolution de ce problème, ils n’ont pas suffisamment intégré les caractéristiques des locuteurs, ni pris en compte l’impact des relations temporelles dans la structure des conversations. Afin de combler partiellement ce manque dans la recherche, nous proposons un cadre novateur pour l’entailment causal émotionnel, appelé MPEG (Multi-Perspective Enhanced Graph Attention Network). L’entraînement de MPEG s’articule en trois étapes. Premièrement, nous utilisons un modèle pré-entraîné sensible au locuteur ainsi que deux mécanismes d’attention pour obtenir des représentations d’énoncés intégrant à la fois les contextes locaux, les informations relatives au locuteur et celles liées à l’émotion. Ensuite, ces représentations sont introduites dans un réseau d’attention sur graphe afin de modéliser les structures de conversation et les dynamiques émotionnelles à la fois à partir de perspectives locales et globales. Enfin, un réseau entièrement connecté est mis en œuvre pour prédire les relations entre les énoncés émotionnels et les énoncés causaux. Les résultats expérimentaux montrent que MPEG atteint des performances de pointe par rapport aux méthodes existantes.