IAM : Un jeu de données complet et à grande échelle pour les tâches d’extraction d’arguments intégrée

Traditionnellement, un débat nécessite généralement un processus de préparation manuelle, incluant la lecture de nombreux articles, la sélection des affirmations, l'identification des positions des affirmations, la recherche de preuves pour les affirmations, etc. Avec l'attention croissante accordée au débat d'intelligence artificielle ces dernières années, il est important d'explorer les méthodes permettant d'automatiser le processus fastidieux impliqué dans le système de débat. Dans cette étude, nous présentons un ensemble de données complet et volumineux nommé IAM, qui peut être utilisé pour une série de tâches d'extraction d'arguments, telles que l'extraction des affirmations, la classification des positions, l'extraction des preuves, etc. Notre ensemble de données est collecté à partir de plus de 1 000 articles liés à 123 sujets. Près de 70 000 phrases dans l'ensemble de données sont entièrement annotées en fonction de leurs propriétés argumentatives (par exemple, affirmations, positions, preuves, etc.). Nous proposons également deux nouvelles tâches intégrées d'extraction d'arguments associées au processus de préparation du débat : (1) l'extraction des affirmations avec classification des positions (CESC) et (2) l'extraction des paires affirmation-preuve (CEPE). Nous utilisons une approche par pipeline et une méthode bout-en-bout pour chaque tâche intégrée séparément. Des résultats expérimentaux prometteurs sont rapportés pour montrer les valeurs et les défis de nos tâches proposées, et encourager les recherches futures en extraction d'arguments.