HyperAIHyperAI
vor 2 Monaten

Domänenübergreifende Extraktion wissenschaftlicher Konzepte aus Forschungsartikeln

Arthur Brack; Jennifer D'Souza; Anett Hoppe; Sören Auer; Ralph Ewerth
Domänenübergreifende Extraktion wissenschaftlicher Konzepte aus Forschungsartikeln
Abstract

Wir untersuchen die neue Aufgabe der domänenübergreifenden Extraktion wissenschaftlicher Konzepte aus den Abstracts wissenschaftlicher Artikel und präsentieren zwei Beiträge. Erstens schlagen wir eine Reihe generischer wissenschaftlicher Konzepte vor, die im Rahmen eines systematischen Annotierungsprozesses identifiziert wurden. Diese Konzeptmenge wird verwendet, um ein Korpus von wissenschaftlichen Abstracts aus 10 Bereichen der Naturwissenschaften, Technik und Medizin auf phrasaler Ebene gemeinsam mit Domänenexperten zu annotieren. Der resultierende Datensatz wird in einer Reihe von Benchmark-Experimenten eingesetzt, um (a) eine Baseline-Leistung für diese Aufgabe bereitzustellen, (b) die Übertragbarkeit von Konzepten zwischen den Bereichen zu untersuchen. Zweitens präsentieren wir zwei Deep-Learning-Systeme als Baselines. Insbesondere schlagen wir aktives Lernen vor, um mit verschiedenen Domänen in unserer Aufgabe umzugehen. Die experimentellen Ergebnisse zeigen, dass (1) nach Konsultation mit Domänenexperten eine erhebliche Übereinstimmung durch Nicht-Experten erreichbar ist, (2) das Baseline-System einen vergleichsweise hohen F1-Wert erreicht, (3) aktives Lernen es uns ermöglicht, die Menge an benötigten Trainingsdaten nahezu zu halbieren.

Domänenübergreifende Extraktion wissenschaftlicher Konzepte aus Forschungsartikeln | Neueste Forschungsarbeiten | HyperAI