Wie wird Ihr Tweet aufgenommen? Vorhersage der Sentiment-Polarität von Tweet-Antworten

Die Analyse von Twitter-Sentiments, die sich oft auf die Vorhersage der Polarität von Tweets konzentriert, hat in den letzten Jahren zunehmend an Bedeutung gewonnen, insbesondere mit dem Aufkommen des tiefen Lernens (Deep Learning, DL). In dieser Arbeit schlagen wir eine neue Aufgabe vor: die Vorhersage des vorherrschenden Sentiments unter den (erststufigen) Antworten auf einen gegebenen Tweet. Zu diesem Zweck haben wir RETWEET erstellt, ein großes Datensatz von Tweets und Antworten, die manuell mit Sentiment-Labels versehen wurden. Als robuste Baseline schlagen wir eine zweistufige methode basierend auf tiefem Lernen vor: Zunächst erstellen wir automatisch beschriftete Trainingsdaten, indem wir einen Standard-Sentiment-Klassifikator auf die Antworten zu Tweets anwenden und dessen Vorhersagen für jeden ursprünglichen Tweet aggregieren; unsere Begründung ist, dass individuelle Fehler des Klassifikators wahrscheinlich im Aggregierungsschritt ausgeglichen werden. Im zweiten Schritt nutzen wir die automatisch beschrifteten Daten zur überwachten Schulung eines neuronalen Netzes, um das Sentiment der Antworten aus den ursprünglichen Tweets vorherzusagen. Der resultierende Klassifikator wird am neuen RETWEET-Datensatz evaluiert und zeigt vielversprechende Ergebnisse, insbesondere wenn man bedenkt, dass er ohne manuell beschriftete Daten trainiert wurde. Sowohl der Datensatz als auch die Baseline-Implementierung sind öffentlich zugänglich.