HyperAIHyperAI
vor 11 Tagen

Einfach aber leistungsstark: Eine übersehene Architektur für die geschachtelte benannte Entitätsenerkennung

{Jocelyn Dunstan, Felipe Bravo-Marquez, Matias Rojas}
Einfach aber leistungsstark: Eine übersehene Architektur für die geschachtelte benannte Entitätsenerkennung
Abstract

Die Erkennung benannter Entitäten (Named Entity Recognition, NER) ist eine zentrale Aufgabe im Bereich der natürlichen Sprachverarbeitung, die darauf abzielt, Textabschnitte zu identifizieren, die zu vordefinierten Kategorien gehören. Traditionelle NER-Systeme ignorieren geschachtelte Entitäten, also solche, die in anderen Entitätsangaben enthalten sind. Obwohl mehrere Ansätze zur Behandlung dieses Problems vorgeschlagen wurden, beruhen die meisten auf komplexen, auf die Aufgabe zugeschnittenen Strukturen und vernachlässigen potenziell nützliche Baseline-Methoden. Wir argumentieren, dass dies ein übermäßig optimistisches Bild der Leistungsfähigkeit dieser Ansätze vermittelt. In diesem Artikel revidieren wir das Multiple LSTM-CRF (MLC)-Modell, einen einfachen, jedoch lange übersehenen, dennoch leistungsfähigen Ansatz, der unabhängige Sequenzmarkierungsmodelle für jede Entitätstypen trainiert. Umfangreiche Experimente an drei Korpora mit geschachtelten NER-Erkenntnissen zeigen, dass das Modell – trotz seiner Einfachheit – eine Leistung erzielt, die entweder besser oder zumindest ebenso gut ist wie die komplexerer Methoden. Darüber hinaus zeigen wir, dass die MLC-Architektur mit der Einbindung prätrainierter Sprachmodelle Zustand-des-Kunst-Ergebnisse für das chilenische Wartelisten-Korpus erreicht. Zudem haben wir eine Open-Source-Bibliothek implementiert, die aufgabenbezogene Metriken für geschachtelte NER berechnet. Die Ergebnisse deuten darauf hin, dass die in früheren Arbeiten verwendeten Metriken die Fähigkeit eines Modells zur Erkennung geschachtelter Entitäten nicht ausreichend messen, während unsere Metriken neue Hinweise darauf liefern, wie bestehende Ansätze diese Aufgabe bewältigen.

Einfach aber leistungsstark: Eine übersehene Architektur für die geschachtelte benannte Entitätsenerkennung | Neueste Forschungsarbeiten | HyperAI