IAM: Ein umfassendes und groß angelegtes Datensatz für integrierte Argumentmining-Aufgaben

Traditionell erfordert ein Debattierprozess in der Regel eine manuelle Vorbereitung, die das Lesen zahlreicher Artikel, die Auswahl von Behauptungen, die Identifizierung der Standpunkte dieser Behauptungen und das Suchen nach Beweisen für diese Behauptungen umfasst. Da künstliche Intelligenz (AI) in den letzten Jahren zunehmend im Fokus der Aufmerksamkeit steht, lohnt es sich, Methoden zur Automatisierung des mühsamen Prozesses zu erforschen, der bei einem Debattiersystem beteiligt ist. In dieser Arbeit stellen wir einen umfassenden und großen Datensatz vor, der IAM genannt wird und auf eine Reihe von Argumentationsmining-Aufgaben angewendet werden kann, darunter die Extraktion von Behauptungen (claim extraction), die Klassifikation von Standpunkten (stance classification) und die Extraktion von Beweisen (evidence extraction). Unser Datensatz wurde aus über 1.000 Artikeln zu 123 Themen gesammelt. Fast 70.000 Sätze im Datensatz sind vollständig aufgrund ihrer argumentativen Eigenschaften (z.B. Behauptungen, Standpunkte, Beweise usw.) annotiert. Wir schlagen zudem zwei neue integrierte Argumentationsmining-Aufgaben vor, die mit dem Debattierprozess verbunden sind: (1) die Extraktion von Behauptungen mit Standpunkt-Klassifikation (CESC – Claim Extraction with Stance Classification) und (2) die Extraktion von Behauptung-Beweis-Paaren (CEPE – Claim-Evidence Pair Extraction). Für jede integrierte Aufgabe verwenden wir sowohl einen Pipeline-Ansatz als auch eine end-to-end-Methode. Versprechende experimentelle Ergebnisse werden präsentiert, um den Nutzen und die Herausforderungen unserer vorgeschlagenen Aufgaben zu zeigen und zukünftige Forschung im Bereich des Argumentationsminings anzuspornen.