HyperAIHyperAI

Command Palette

Search for a command to run...

Einfach aber leistungsstark: Eine übersehene Architektur für die geschachtelte benannte Entitätsenerkennung

Jocelyn Dunstan Felipe Bravo-Marquez Matias Rojas

Zusammenfassung

Die Erkennung benannter Entitäten (Named Entity Recognition, NER) ist eine zentrale Aufgabe im Bereich der natürlichen Sprachverarbeitung, die darauf abzielt, Textabschnitte zu identifizieren, die zu vordefinierten Kategorien gehören. Traditionelle NER-Systeme ignorieren geschachtelte Entitäten, also solche, die in anderen Entitätsangaben enthalten sind. Obwohl mehrere Ansätze zur Behandlung dieses Problems vorgeschlagen wurden, beruhen die meisten auf komplexen, auf die Aufgabe zugeschnittenen Strukturen und vernachlässigen potenziell nützliche Baseline-Methoden. Wir argumentieren, dass dies ein übermäßig optimistisches Bild der Leistungsfähigkeit dieser Ansätze vermittelt. In diesem Artikel revidieren wir das Multiple LSTM-CRF (MLC)-Modell, einen einfachen, jedoch lange übersehenen, dennoch leistungsfähigen Ansatz, der unabhängige Sequenzmarkierungsmodelle für jede Entitätstypen trainiert. Umfangreiche Experimente an drei Korpora mit geschachtelten NER-Erkenntnissen zeigen, dass das Modell – trotz seiner Einfachheit – eine Leistung erzielt, die entweder besser oder zumindest ebenso gut ist wie die komplexerer Methoden. Darüber hinaus zeigen wir, dass die MLC-Architektur mit der Einbindung prätrainierter Sprachmodelle Zustand-des-Kunst-Ergebnisse für das chilenische Wartelisten-Korpus erreicht. Zudem haben wir eine Open-Source-Bibliothek implementiert, die aufgabenbezogene Metriken für geschachtelte NER berechnet. Die Ergebnisse deuten darauf hin, dass die in früheren Arbeiten verwendeten Metriken die Fähigkeit eines Modells zur Erkennung geschachtelter Entitäten nicht ausreichend messen, während unsere Metriken neue Hinweise darauf liefern, wie bestehende Ansätze diese Aufgabe bewältigen.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Einfach aber leistungsstark: Eine übersehene Architektur für die geschachtelte benannte Entitätsenerkennung | Paper | HyperAI