HyperAIHyperAI
vor 2 Monaten

AxCell: Automatische Extraktion von Ergebnissen aus maschinelles Lernen-Papieren

Marcin Kardas; Piotr Czapla; Pontus Stenetorp; Sebastian Ruder; Sebastian Riedel; Ross Taylor; Robert Stojnic
AxCell: Automatische Extraktion von Ergebnissen aus maschinelles Lernen-Papieren
Abstract

Die Verfolgung des Fortschritts im maschinellen Lernen ist mit dem jüngsten Anstieg der Anzahl von Publikationen zunehmend schwieriger geworden. In dieser Arbeit stellen wir AxCell vor, einen automatischen Pipeline für das maschinelle Lernen, der es ermöglicht, Ergebnisse aus wissenschaftlichen Arbeiten zu extrahieren. AxCell nutzt mehrere innovative Komponenten, darunter eine Tabellensegmentierungsaufgabe, um relevante strukturelle Kenntnisse zu erlernen, die die Extraktion unterstützen. Im Vergleich zu bestehenden Methoden verbessert unser Ansatz den Stand der Technik bei der Ergebnisextraktion erheblich. Wir veröffentlichen außerdem ein strukturiertes, annotiertes Datenset zur Ausbildung von Modellen für die Ergebnisextraktion sowie ein Datenset zur Bewertung der Leistung dieser Modelle bei dieser Aufgabe. Schließlich zeigen wir die Machbarkeit unseres Ansatzes, der es ermöglicht, in der Produktion halbautomatisch Ergebnisse zu extrahieren, was darauf hindeutet, dass unsere Verbesserungen diese Aufgabe zum ersten Mal praktisch machbar machen. Der Quellcode ist auf GitHub verfügbar.