HyperAIHyperAI
vor 17 Tagen

FLERT: Dokumentebene Merkmale für die benannte Entitätsenerkennung

Stefan Schweter, Alan Akbik
FLERT: Dokumentebene Merkmale für die benannte Entitätsenerkennung
Abstract

Aktuelle state-of-the-art-Ansätze für die Erkennung benannter Entitäten (Named Entity Recognition, NER) berücksichtigen in der Regel nur Text auf Satzebene und modellieren daher Informationen nicht, die über Satzgrenzen hinausgehen. Die Verwendung von Transformer-basierten Modellen für NER bietet jedoch natürliche Möglichkeiten, dokumentenweite Merkmale zu erfassen. In diesem Paper führen wir eine vergleichende Evaluation von dokumentenweiten Merkmalen in zwei etablierten NER-Architekturen durch, die in der Literatur häufig betrachtet werden: „Fine-Tuning“ und „feature-basiertes LSTM-CRF“. Wir evaluieren verschiedene Hyperparameter für dokumentenweite Merkmale, wie beispielsweise die Größe des Kontextfensters und die Durchsetzung von dokumentenlokalität. Anhand durchgeführter Experimente leiten wir Empfehlungen ab, wie dokumentenweiter Kontext am effektivsten modelliert werden kann, und präsentieren neue state-of-the-art-Ergebnisse auf mehreren CoNLL-03-Benchmark-Datensätzen. Unser Ansatz ist in das Flair-Framework integriert, um die Reproduzierbarkeit unserer Experimente zu erleichtern.

FLERT: Dokumentebene Merkmale für die benannte Entitätsenerkennung | Neueste Forschungsarbeiten | HyperAI