HyperAIHyperAI
il y a 17 jours

Reconnaissance précise d'entités nommées en clinique et en biomédecine à grande échelle

{David, Veysel; Talby, Kocaman}
Résumé

Nous présentons un algorithme agile et prêt à l’emploi pour la reconnaissance d’entités nommées (NER) en clinique et en biotechnologie, basé sur une architecture modifiée BiLSTM-CNN-Char à apprentissage profond (DL), construite sur la plateforme Apache Spark. Notre implémentation de NER établit de nouveaux états de l’art en précision sur 7 des 8 benchmarks bien établis en NER biomédical ainsi que sur 3 défis d’extraction de concepts cliniques : l’extraction de concepts cliniques i2b2/VA 2010, la désidentification n2c2 2014 et l’extraction de médicaments n2c2 2018. En outre, les modèles de NER clinique entraînés grâce à cette implémentation surpassent largement la précision des solutions commerciales d’extraction d’entités, à savoir AWS Medical Comprehend et Google Cloud Healthcare API, avec des gains respectifs de 8,9 % et 6,7 %, sans recourir à des modèles linguistiques intensifs en mémoire.