HyperAIHyperAI
vor 2 Monaten

Gemeinsame Entitätserkennung und Relationsextraktion als Mehrfachauswahlproblem

Giannis Bekoulis; Johannes Deleu; Thomas Demeester; Chris Develder
Gemeinsame Entitätserkennung und Relationsextraktion als Mehrfachauswahlproblem
Abstract

Zustandsderkunst-Modelle für die gemeinsame Erkennung von Entitäten und Relationsextraktion hängen stark von externen Werkzeugen der natürlichen Sprachverarbeitung (NLP) wie POS-Taggern (Part-of-Speech) und Abhängigkeitsparsern ab. Daher hängt die Leistung solcher kombinierter Modelle von der Qualität der Merkmale, die durch diese NLP-Werkzeuge gewonnen werden, ab. Allerdings sind diese Merkmale nicht immer für verschiedene Sprachen und Kontexte genau. In dieser Arbeit schlagen wir ein gemeinsames neuronales Modell vor, das Entitäten und Relationen gleichzeitig erkennt, ohne manuell extrahierte Merkmale oder externe Werkzeuge zu benötigen. Insbesondere modellieren wir die Aufgabe der Entitätserkennung mit einer CRF-Schicht (Conditional Random Fields) und die Aufgabe der Relationsextraktion als ein Mehrfachauswahlproblem (d.h., potentiell mehrere Relationen pro Entität identifizieren). Wir präsentieren eine umfangreiche experimentelle Auswertung, um die Effektivität unserer Methode anhand von Datensätzen aus verschiedenen Kontexten (z.B., Nachrichten, Biomedizin, Immobilien) und Sprachen (z.B., Englisch, Niederländisch) zu demonstrieren. Unser Modell übertrifft die früheren neuronalen Modelle, die automatisch extrahierte Merkmale verwenden, während es innerhalb eines akzeptablen Bereichs an den leistungsstärkeren featurebasierten neuronalen Modellen liegt oder sie sogar übertreffen kann.