Strukturelle Gerüste für die Klassifizierung von Zitierabsichten in wissenschaftlichen Publikationen

Die Identifizierung der Absicht einer Zitation in wissenschaftlichen Publikationen (z.B. Hintergrundinformationen, Verwendung von Methoden, Vergleich von Ergebnissen) ist entscheidend für das maschinelle Lesen einzelner Veröffentlichungen und die automatisierte Analyse der wissenschaftlichen Literatur. Wir schlagen strukturelle Gerüste vor, ein Multitask-Modell, das strukturelle Informationen wissenschaftlicher Arbeiten in Zitate einbezieht, um die Klassifikation von Zitationsabsichten effektiv zu verbessern. Unser Modell erreicht einen neuen Stand der Technik auf einem bestehenden ACL-Anthology-Datensatz (ACL-ARC) mit einem absoluten Anstieg des F1-Scores um 13,3 %, ohne auf externe linguistische Ressourcen oder manuell entwickelte Merkmale wie bei existierenden Methoden zurückzugreifen. Darüber hinaus stellen wir einen neuen Datensatz von Zitationsabsichten (SciCite) vor, der mehr als fünfmal größer ist und mehrere wissenschaftliche Bereiche abdeckt im Vergleich zu bestehenden Datensätzen. Unser Code und unsere Daten sind unter folgender URL verfügbar: https://github.com/allenai/scicite.