vor 18 Tagen
Was können wir aus fast einem Jahrzehnt an Essens-Tweets lernen
Uga Sproģis, Matīss Rikters

Abstract
Wir präsentieren den Latvian Twitter Eater Corpus – eine Sammlung von Tweets aus einem engen Spezialbereich, der sich mit Essen, Getränken, Ess- und Trinkverhalten beschäftigt. Das Korpus wurde über einen Zeitraum von über acht Jahren gesammelt und umfasst über zwei Millionen Tweets, die jeweils zusätzliche nützliche Metadaten enthalten. Zudem gliedern wir das Korpus in zwei Teilkorpora: ein Teil umfasst Fragen und Antworten, der andere ist hinsichtlich der Stimmung (Sentiment) annotiert. Wir analysieren die Inhalte des Korpus und demonstrieren Anwendungsfälle für die Teilkorpora, indem wir domain-spezifische Modelle für Fragebeantwortung und Sentiment-Analyse anhand der Korpusdaten trainieren.