HyperAIHyperAI
il y a 2 mois

TACO -- Arguments de Twitter issus de Conversations

Marc Feger; Stefan Dietze
TACO -- Arguments de Twitter issus de Conversations
Résumé

Twitter est devenu un centre mondial pour la participation aux conversations en ligne et un corpus de recherche pour diverses disciplines qui ont reconnu l'importance de son contenu généré par les utilisateurs. L'extraction d'arguments est une tâche analytique importante pour le traitement et la compréhension du discours en ligne. Plus précisément, elle vise à identifier les éléments structuraux des arguments, désignés comme information et inférence. Ces éléments ne sont cependant pas statiques et peuvent nécessiter un contexte au sein de la conversation dans laquelle ils se trouvent, bien qu'il manque des données et des cadres d'annotation abordant cet aspect dynamique sur Twitter. Nous contribuons avec TACO, le premier jeu de données d'arguments Twitter utilisant 1 814 tweets couvrant 200 conversations complètes sur six sujets hétérogènes, annotées avec un accord de 0,718 selon l'alpha de Krippendorff parmi six experts. Deuxièmement, nous fournissons notre cadre d'annotation, incorporant des définitions du Dictionnaire de Cambridge, pour définir et identifier les composants des arguments sur Twitter. Notre classifieur basé sur les transformateurs atteint un score de base macro F1 de 85,06 % dans la détection des arguments. De plus, nos données révèlent que les utilisateurs de Twitter ont tendance à participer à des discussions impliquant des inférences informées et des informations. TACO sert plusieurs objectifs, tels que l'entraînement de classifieurs de tweets pour gérer les tweets en fonction des éléments d'inférence et d'information, tout en fournissant des insights précieux sur les modèles de réponses conversationnelles des tweets.