Participation de BOUN-ISIK : Une approche non supervisée pour la normalisation des entités nommées et l'extraction de relations dans les biotopes bactériens

Cet article présente notre participation à la tâche Bacteria Biotope du BioNLP Shared Task 2019. Notre contribution inclut deux systèmes, chacun dédié à l'une des deux sous-tâches de la tâche Bacteria Biotope : la normalisation des entités (BB-norm) et l'identification des relations entre entités à partir d'un texte biomédical (BB-rel). Pour la normalisation des entités, nous avons utilisé des embeddings de mots ainsi qu'un re-trieval syntaxique. Pour la tâche d'extraction de relations, nous avons appliqué des règles prédéfinies. Bien que les deux approches soient non supervisées, au sens où elles ne nécessitent aucune donnée étiquetée, elles ont obtenu des résultats prometteurs. En particulier, pour la tâche BB-norm, les résultats montrent que la méthode proposée atteint des performances comparables à celles des méthodes basées sur l'apprentissage profond, qui requièrent toutefois des données étiquetées.