Comment Votre Tweet Sera-t-il Reçu ? Prédiction de la Polarité Émotionnelle des Réponses aux Tweets

L'analyse de l'opinion sur Twitter, qui se concentre souvent sur la prédiction de la polarité des tweets, a attiré une attention croissante ces dernières années, en particulier avec l'émergence de l'apprentissage profond (DL). Dans cet article, nous proposons une nouvelle tâche : prédire le sentiment prédominant parmi les réponses de premier ordre à un tweet donné. À cette fin, nous avons créé RETWEET, un grand ensemble de données composé de tweets et de réponses manuellement annotés avec des étiquettes de sentiment. En tant que ligne de base solide, nous proposons une méthode en deux étapes basée sur l'apprentissage profond : premièrement, nous créons des données d'entraînement automatiquement étiquetées en appliquant un classifieur d'opinion standard aux réponses aux tweets et en agrégant ses prédictions pour chaque tweet original ; notre raisonnement est que les erreurs individuelles commises par le classifieur sont susceptibles de s'annuler lors de l'étape d'agrégation. Deuxièmement, nous utilisons les données automatiquement étiquetées pour entraîner supervisément un réseau neuronal afin de prédire le sentiment des réponses à partir des tweets originaux. Le classifieur résultant est évalué sur le nouveau jeu de données RETWEET, montrant des résultats prometteurs, notamment compte tenu du fait qu'il a été entraîné sans aucune donnée manuellement étiquetée. À la fois le jeu de données et l'implémentation de la ligne de base sont disponibles au public.