Kernellösung in Forschungspapieren aus mehreren Domänen

Die Kernreferenzauflösung ist entscheidend für die automatische Textverarbeitung, um hochwertige Informationsabfragetasks wie Textzusammenfassung oder Fragebeantwortung zu ermöglichen. Frühere Arbeiten zeigen, dass die Leistung modernster Ansätze (z. B. auf Basis von BERT) bei der Anwendung auf wissenschaftliche Artikel deutlich abnimmt. In diesem Paper untersuchen wir die Aufgabe der Kernreferenzauflösung in Forschungsarbeiten sowie deren Anwendung für die automatische Bevölkerung von Wissensgraphen (Knowledge Graphs, KG). Wir leisten folgende Beiträge: (1) Wir annotieren eine Korpus für die Kernreferenzauflösung, das 10 verschiedene wissenschaftliche Disziplinen aus den Bereichen Science, Technology und Medicine (STM) umfasst; (2) Wir stellen einen Transfer-Lernansatz für die automatische Kernreferenzauflösung in Forschungsarbeiten vor; (3) Wir analysieren den Einfluss der Kernreferenzauflösung auf die Bevölkerung von Wissensgraphen; (4) Wir veröffentlichen einen Forschungs-Wissensgraphen, der automatisch aus 55.485 wissenschaftlichen Arbeiten in 10 STM-Bereichen generiert wurde. Umfassende Experimente belegen die Nützlichkeit des vorgeschlagenen Ansatzes. Unser Transfer-Lernansatz übertrifft die derzeitigen State-of-the-Art-Baselines auf unserem Korpus deutlich, erreicht dabei einen F1-Score von 61,4 (+11,0). Zudem zeigt die Evaluation anhand eines Gold-Standard-Wissensgraphen, dass die Kernreferenzauflösung die Qualität des befüllten Wissensgraphen signifikant verbessert – mit einem F1-Score von 63,5 (+21,8).