HyperAIHyperAI
il y a 17 jours

Un outil de reconnaissance des entités nommées et de normalisation multi-types basé sur un modèle neuronal pour l’extraction de connaissances dans les textes biomédicaux

{Jaewoo Kang, Mujeen Sung, Wonjin Yoon, Yonghwa Choi, Minbyul Jeong, Hwisang Jeon, Chan Ho So, Jinhyuk Lee, Donghyeon Kim}
Résumé

La quantité de littérature biomédicale est considérable et croît rapidement, et des techniques précises d’extraction de texte pourraient aider les chercheurs à extraire efficacement des informations utiles à partir de cette littérature. Toutefois, les modèles actuels de reconnaissance d’entités nommées utilisés par les outils d’extraction de texte tels que tmTool et ezTag ne sont pas suffisamment performants et ne parviennent pas à identifier avec précision de nouvelles entités. De plus, les outils traditionnels d’extraction de texte ne prennent pas en compte les entités chevauchantes, qui sont fréquemment observées dans les résultats de reconnaissance d’entités nommées de plusieurs types. Nous proposons un outil basé sur les réseaux neuronaux pour la reconnaissance d’entités nommées biomédicales et la normalisation multi-type, appelé BERN. BERN utilise des modèles de reconnaissance d’entités nommées BioBERT de haute performance, capables à la fois de reconnaître des entités connues et de découvrir de nouvelles entités. Des règles décisionnelles basées sur la probabilité sont également développées pour identifier les types des entités chevauchantes. En outre, divers modèles de normalisation d’entités nommées sont intégrés dans BERN afin d’attribuer un identifiant distinct à chaque entité détectée. BERN met à disposition un service web permettant d’étiqueter les entités dans les articles PubMed ou dans des textes bruts. Les chercheurs peuvent utiliser ce service web pour leurs tâches d’extraction de texte, telles que la découverte de nouvelles entités nommées, la récupération d’information, la réponse à des questions ou l’extraction de relations. Les interfaces de programmation applicative (API) et des démonstrations de BERN sont disponibles publiquement à l’adresse suivante : https://bern.korea.ac.kr

Un outil de reconnaissance des entités nommées et de normalisation multi-types basé sur un modèle neuronal pour l’extraction de connaissances dans les textes biomédicaux | Articles de recherche récents | HyperAI