HyperAIHyperAI
vor 17 Tagen

Ein neuronales Named Entity Recognition- und Multi-Type-Normalisierungswerkzeug für die biomedizinische Textmining-Analyse

{Jaewoo Kang, Mujeen Sung, Wonjin Yoon, Yonghwa Choi, Minbyul Jeong, Hwisang Jeon, Chan Ho So, Jinhyuk Lee, Donghyeon Kim}
Abstract

Die Menge an biomedizinischer Literatur ist enorm und wächst rasch, und präzise Textmining-Techniken könnten Forschern helfen, effizient nützliche Informationen aus dieser Literatur zu extrahieren. Allerdings sind die bisherigen Named-Entity-Recognition-(NER)-Modelle, die von Textmining-Tools wie tmTool und ezTag verwendet werden, nicht ausreichend effektiv und können neue Entitäten nicht genau erkennen. Zudem berücksichtigen traditionelle Textmining-Tools keine überlappenden Entitäten, die bei der Erkennung mehrerer Entitätstypen häufig beobachtet werden. Wir stellen ein neuronales biomedizinisches Named-Entity-Recognition- und Multi-Typ-Normalisierungstool namens BERN vor. BERN nutzt leistungsstarke BioBERT-Modelle zur Named-Entity-Recognition, die sowohl bekannte als auch neue Entitäten erkennen können. Zudem wurden wahrscheinlichkeitbasierte Entscheidungsregeln entwickelt, um die Typen überlagernder Entitäten zu identifizieren. Darüber hinaus sind verschiedene Named-Entity-Normalisierungsmodelle in BERN integriert, um jeder erkannten Entität eine eindeutige Identifikationsnummer zuzuweisen. BERN bietet eine Webdienst-API zur Markierung von Entitäten in PubMed-Artikeln oder Rohtexten. Forscher können den BERN-Webdienst für ihre Textmining-Aufgaben nutzen, beispielsweise zur Entdeckung neuer Named Entities, Informationsretrieval, Fragebeantwortung und Relationsextraktion. Die Programmierschnittstellen und Demonstrationsbeispiele von BERN sind öffentlich unter https://bern.korea.ac.kr verfügbar.

Ein neuronales Named Entity Recognition- und Multi-Type-Normalisierungswerkzeug für die biomedizinische Textmining-Analyse | Neueste Forschungsarbeiten | HyperAI