HyperAIHyperAI
vor 2 Monaten

End-to-End neuronale Entitätensverknüpfung

Nikolaos Kolitsas; Octavian-Eugen Ganea; Thomas Hofmann
End-to-End neuronale Entitätensverknüpfung
Abstract

Entitätserkennung (EL) ist eine wesentliche Aufgabe für die semantische Textverarbeitung und die Informationsextraktion. Gängige Methoden behandeln die Stufen der Erwähnungsidentifikation (MD) und Entitätsaufklärung (ED) von EL getrennt voneinander, ohne ihre gegenseitige Abhängigkeit zu nutzen. In diesem Beitrag stellen wir das erste neuronale End-to-End-EL-System vor, das Entitäten in einem Textdokument gleichzeitig entdeckt und verlinkt. Das Kernkonzept besteht darin, alle möglichen Spannen als potenzielle Erwähnungen zu betrachten und kontextsensitive Ähnlichkeitswerte über ihre Entitätskandidaten zu lernen, die sowohl für MD- als auch für ED-Entscheidungen nützlich sind. Wesentliche Komponenten sind kontextsensible Erwähnungsembeddings, Entitätsembeddings und eine wahrscheinlichkeitstheoretische Zuordnung zwischen Erwähnungen und Entitäten, ohne andere konstruierte Merkmale zu erfordern. Empirisch zeigen wir, dass unsere End-to-End-Methode bei ausreichendem Trainingsdatensatz erheblich bessere Ergebnisse als gängige Systeme auf der Gerbil-Plattform erzielt. Umgekehrt, wenn Testdatensätze andere Annotationskonventionen aufweisen als der Trainingsdatensatz (z.B. Anfragen/Tweets im Vergleich zu Nachrichtendokumenten), bietet unser ED-Modell in Kombination mit einem traditionellen NER-System die besten oder zweitbesten EL-Accuracy-Werte.

End-to-End neuronale Entitätensverknüpfung | Neueste Forschungsarbeiten | HyperAI