Command Palette
Search for a command to run...
Ein neuronales Named Entity Recognition- und Multi-Type-Normalisierungswerkzeug für die biomedizinische Textmining-Analyse
Ein neuronales Named Entity Recognition- und Multi-Type-Normalisierungswerkzeug für die biomedizinische Textmining-Analyse
Jaewoo Kang Mujeen Sung Wonjin Yoon Yonghwa Choi Minbyul Jeong Hwisang Jeon Chan Ho So Jinhyuk Lee Donghyeon Kim
Zusammenfassung
Die Menge an biomedizinischer Literatur ist enorm und wächst rasch, und präzise Textmining-Techniken könnten Forschern helfen, effizient nützliche Informationen aus dieser Literatur zu extrahieren. Allerdings sind die bisherigen Named-Entity-Recognition-(NER)-Modelle, die von Textmining-Tools wie tmTool und ezTag verwendet werden, nicht ausreichend effektiv und können neue Entitäten nicht genau erkennen. Zudem berücksichtigen traditionelle Textmining-Tools keine überlappenden Entitäten, die bei der Erkennung mehrerer Entitätstypen häufig beobachtet werden. Wir stellen ein neuronales biomedizinisches Named-Entity-Recognition- und Multi-Typ-Normalisierungstool namens BERN vor. BERN nutzt leistungsstarke BioBERT-Modelle zur Named-Entity-Recognition, die sowohl bekannte als auch neue Entitäten erkennen können. Zudem wurden wahrscheinlichkeitbasierte Entscheidungsregeln entwickelt, um die Typen überlagernder Entitäten zu identifizieren. Darüber hinaus sind verschiedene Named-Entity-Normalisierungsmodelle in BERN integriert, um jeder erkannten Entität eine eindeutige Identifikationsnummer zuzuweisen. BERN bietet eine Webdienst-API zur Markierung von Entitäten in PubMed-Artikeln oder Rohtexten. Forscher können den BERN-Webdienst für ihre Textmining-Aufgaben nutzen, beispielsweise zur Entdeckung neuer Named Entities, Informationsretrieval, Fragebeantwortung und Relationsextraktion. Die Programmierschnittstellen und Demonstrationsbeispiele von BERN sind öffentlich unter https://bern.korea.ac.kr verfügbar.