HyperAIHyperAI
vor 17 Tagen

Steigerung der Label-Konsistenz bei der dokumentweiten benannten Entitätenerkennung

Minbyul Jeong, Jaewoo Kang
Steigerung der Label-Konsistenz bei der dokumentweiten benannten Entitätenerkennung
Abstract

Die Erkennung benannter Entitäten (Named Entity Recognition, NER) ist ein zentraler Bestandteil der Informationsextraktion aus Dokumenten in biomedizinischen Anwendungen. Ein wesentlicher Vorteil der NER liegt in der Konsistenz der Extraktion biomedizinischer Entitäten im Kontext eines Dokuments. Obwohl bestehende Dokument-NER-Modelle konsistente Vorhersagen liefern, erreichen sie dennoch nicht unsere Erwartungen. Wir haben untersucht, ob Adjektive und Präpositionen innerhalb einer Entität zu einer geringen Label-Konsistenz führen, was inkonsistente Vorhersagen verursacht. In diesem Paper präsentieren wir unsere Methode ConNER, die die Label-Abhängigkeit von Modifikatoren (z. B. Adjektive und Präpositionen) verstärkt, um eine höhere Label-Konsistenz zu erreichen. ConNER verfeinert die vorläufigen Labels der Modifikatoren, um die Ausgaberepräsentationen biomedizinischer Entitäten zu verbessern. Die Wirksamkeit unserer Methode wird an vier etablierten biomedizinischen NER-Datensätzen nachgewiesen; insbesondere zeigt sie auf zwei Datensätzen absolute Verbesserungen des F1-Scores um 7,5–8,6 %. Wir interpretieren, dass unsere ConNER-Methode besonders effektiv ist bei Datensätzen mit intrinsisch geringer Label-Konsistenz. In der qualitativen Analyse demonstrieren wir, wie unser Ansatz das NER-Modell dazu bringt, konsistente Vorhersagen zu generieren. Unser Code und die zugänglichen Ressourcen sind unter https://github.com/dmis-lab/ConNER/ verfügbar.