Verbesserung der biomedizinischen benannten Entitätserkennung durch syntaktische Informationen
Die Erkennung biomedizinischer Named Entities (BioNER) ist eine zentrale Aufgabe zur Verständnis biomedizinischer Texte, die aufgrund des Mangels an großskaligen annotierten Trainingsdaten und fachspezifischem Domänenwissen herausfordernd sein kann. Um diese Herausforderung anzugehen, werden neben leistungsstarken Encodern (z. B. biLSTM und BioBERT) möglicherweise zusätzliche, leicht zugängliche Wissensressourcen genutzt. Frühere Studien haben gezeigt, dass automatisch verarbeitete syntaktische Informationen eine nützliche Ressource darstellen können, um die Modellleistung zu verbessern. Allerdings beschränken sich ihre Ansätze auf die direkte Verkettung der Embeddings syntaktischer Informationen mit den Eingabewort-Embeddings. Dadurch wird die syntaktische Information auf eine starre und unflexible Weise genutzt, wodurch ungenaue Informationen die Modellleistung beeinträchtigen können. In diesem Artikel stellen wir BIOKMNER vor, ein BioNER-Modell für biomedizinische Texte, das Schlüssel-Wert-Gedächtnisnetzwerke (Key-Value Memory Networks, KVMN) nutzt, um automatisch verarbeitete syntaktische Informationen effektiv zu integrieren. Wir evaluieren BIOKMNER an sechs englischen biomedizinischen Datensätzen, wobei unsere Methode mit KVMN auf allen Datensätzen die starke Baseline, nämlich BioBERT aus früheren Studien, übertrifft. Insbesondere erreicht unser bestes Modell F1-Scores von 85,29 % auf BC2GM, 77,83 % auf JNLPBA, 94,22 % auf BC5CDR-chemical, 90,08 % auf NCBI-disease, 89,24 % auf LINNAEUS und 76,33 % auf Species-800, wobei state-of-the-art-Leistung auf vier von ihnen erzielt wird (nämlich BC2GM, BC5CDR-chemical, NCBI-disease und Species-800). Die experimentellen Ergebnisse an sechs englischen Benchmark-Datensätzen zeigen, dass automatisch verarbeitete syntaktische Informationen eine nützliche Ressource für die BioNER darstellen und unsere Methode mit KVMN diese Informationen angemessen nutzen kann, um die Modellleistung zu steigern.