NELEC à SemEval-2019 Tâche 3 : Réfléchissez Deux Fois Avant de Plonger Profondément

Les techniques de Machine Learning actuelles atteignent des performances proches de celles humaines dans les tâches de classification basées sur le texte. Cependant, la présence de bruit multi-modal dans les données de chat, telles que les émoticônes, le jargon, les fautes d'orthographe, les données mixtes en codes, etc., fait en sorte que les solutions existantes basées sur l'apprentissage profond (deep learning) se dégradent considérablement. L'incapacité des systèmes d'apprentissage profond à capturer robustement ces covariables limite leurs performances. Nous proposons NELEC : Combinateur neuronal et lexical, un système qui combine élégamment des méthodes textuelles et basées sur l'apprentissage profond pour la classification de sentiments. Nous évaluons notre système dans le cadre de la troisième tâche du « Détection contextuelle des émotions dans le texte » lors de SemEval-2019. Notre système performe significativement mieux que la ligne de base (baseline) ainsi que nos modèles d'apprentissage profond utilisés comme référence. Il a obtenu un score F1 micro-moyenné de 0,7765, se classant 3ème au tableau des scores du jeu de test. Notre code est disponible à l'adresse suivante : https://github.com/iamgroot42/nelec