Extraction de caractéristiques neuronales pour la détection émotionnelle contextuelle

Cet article présente une nouvelle approche pour la tâche de détection émotionnelle contextuelle. Cette approche repose sur un extracteur de caractéristiques neuronal composé d’un réseau de neurones récurrents munis d’un mécanisme d’attention, suivi d’un classificateur pouvant être neuronal ou basé sur une machine à vecteurs de support (SVM). Nous avons évalué le modèle sur le jeu de données de la tâche 3 de SemEval 2019 (EmoContext), qui comprend des conversations courtes de trois tours, étiquetées selon quatre classes émotionnelles. La configuration optimale a été obtenue en utilisant des embeddings de mots ELMo ainsi que des étiquettes de part-of-speech (POS) comme entrée, des unités cachées bidirectionnelles GRU, et une SVM comme classificateur final. Cette configuration a atteint un score de 69,93 % en F1-score moyen micro sur les trois principales classes émotionnelles, un résultat qui dépasse celui du système de base de 11,25 %.