il y a 17 jours
Qu’est-ce que nous pouvons apprendre de presque une décennie de tweets alimentaires
Uga Sproģis, Matīss Rikters

Résumé
Nous présentons le Latvian Twitter Eater Corpus — un ensemble de tweets appartenant à un domaine étroit lié à la nourriture, aux boissons, à la consommation alimentaire et à la boisson. Ce corpus a été collecté sur une période dépassant huit ans et comprend plus de deux millions de tweets, accompagnés de données supplémentaires utiles. Nous avons également séparé deux sous-corpus : l’un composé de tweets posant des questions et de leurs réponses, l’autre de tweets annotés selon leur sentiment. Nous analysons le contenu du corpus et illustrons des cas d’utilisation des sous-corpus en entraînant des modèles spécialisés dans la réponse aux questions et l’analyse de sentiment, à partir des données du corpus.