HyperAIHyperAI
il y a 18 jours

DataStories à SemEval-2017 Tâche 4 : LSTM profond avec attention pour l'analyse de sentiment au niveau du message et basée sur les sujets

{Christos Doulkeridis, Christos Baziotis, Nikos Pelekis}
DataStories à SemEval-2017 Tâche 4 : LSTM profond avec attention pour l'analyse de sentiment au niveau du message et basée sur les sujets
Résumé

Dans cet article, nous présentons deux systèmes basés sur l’apprentissage profond qui ont participé à la tâche 4 de SemEval-2017 intitulée « Analyse de sentiment dans Twitter ». Nous avons participé à toutes les sous-tâches pour les tweets en anglais, portant sur la classification et la quantification de la polarité du sentiment au niveau du message ainsi que selon les sujets. Nos modèles reposent sur des réseaux de mémoire à long et court terme (LSTM), enrichis par deux types d’attention, et sont alimentés par des embeddings de mots pré-entraînés sur une vaste collection de messages Twitter. Par ailleurs, nous proposons un outil de traitement de texte spécifiquement conçu pour les messages issus des réseaux sociaux, qui effectue la tokenisation, la normalisation des mots, la segmentation et la correction orthographique. Notons que notre approche ne fait usage ni de caractéristiques manuellement conçues ni de lexiques de sentiment. Nous avons obtenu le premier rang (ex-aequo) à la sous-tâche A, ainsi que des résultats très compétitifs aux autres sous-tâches. Les embeddings de mots ainsi que notre outil de traitement de texte sont mis à disposition de la communauté scientifique.