Gemeinsame Entität- und Relationsextraktion aus wissenschaftlichen Dokumenten: Rolle linguistischer Informationen und Entitätstypen
{Partha Pratim Das Debarshi Kumar Sanyal Sudakshina Dutta Prantika Chakraborty T Y S S Santosh}

Abstract
Wissenschaftliche Artikel enthalten verschiedene Arten von fachspezifischen Entitäten sowie Beziehungen zwischen ihnen. Entitäten und ihre Beziehungen fassen wichtige Informationen zum Thema des Dokuments prägnant zusammen und sind daher entscheidend für das Verständnis und die automatisierte Analyse der Dokumente. In diesem Paper zielen wir darauf ab, Entitäten und Beziehungen aus wissenschaftlichen Zusammenfassungen (abstracts) mithilfe eines tiefen neuronalen Modells automatisch zu extrahieren. Gegeben einen Eingabesatz verwenden wir einen vortrainierten Transformer, um kontextuelle Embeddings der Tokens zu erzeugen, die anschließend durch Embeddings ihrer Part-of-Speech (POS)-Tags angereichert werden. Eine Folge angereicherter Tokenrepräsentationen bildet einen Span, und Entitäten sowie Beziehungen werden gemeinsam über Spannweiten gelernt. Die von dem Entitätsklassifikator vorhergesagten Entitätslogits dienen als Merkmale im Beziehungsklassifikator. Das vorgeschlagene Modell übertrifft in der Leistung auf den Datensätzen SciERC und ADE gegenüber bestehenden Benchmarks sowohl bei der Entitäts- als auch bei der Beziehungsextraktion.
Benchmarks
| Benchmark | Methodik | Metriken |
|---|---|---|
| joint-entity-and-relation-extraction-on | SpERT.PL (SciBERT) | Cross Sentence: No Entity F1: 70.53 Relation F1: 51.25 |
| relation-extraction-on-ade-corpus | SpERT.PL (with overlap and BioBERT) | NER Macro F1: 91.17 RE+ Macro F1: 82.03 |
| relation-extraction-on-ade-corpus | SpERT.PL (without overlap and BioBERT) | NER Macro F1: 91.14 RE+ Macro F1: 82.39 |
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.