Une méthode d'ensemble CNN pour la normalisation des entités biomédicales

Différentes représentations du même concept apparaissent fréquemment dans les rapports et publications scientifiques. La normalisation des entités (ou lien d'entités) consiste à associer ces différentes représentations à leurs concepts standard. Dans cet article, nous présentons une méthode en deux étapes basée sur un ensemble de réseaux de neurones convolutifs (CNN) pour normaliser les entités liées à la microbiologie dans des textes libres vers des concepts figurant dans des dictionnaires standard. Cette méthode est capable de lier les entités même lorsque seules de petites corpora biomédicaux spécifiques à la microbiologie sont disponibles pour l'entraînement, et a obtenu des performances raisonnables lors du test en ligne de la tâche partagée BioNLP-OST19, Bacteria Biotope.