C-Norm : une approche neuronale pour la normalisation d'entités en peu d'exemples

La normalisation des entités est une tâche essentielle d’extraction d’informations qui a retrouvé un intérêt croissant au cours de la dernière décennie, notamment dans les domaines biomédicaux et des sciences de la vie. Dans ces domaines, et plus généralement dans tous les domaines spécialisés, cette tâche reste difficile pour les approches basées sur l’apprentissage automatique les plus récentes, qui peinent à gérer des problèmes à très grand nombre de classes et à apprentissage peu supervisé (few-shot learning). Pour relever ce défi, nous proposons C-Norm, une nouvelle approche neuronale qui combine de manière synergique la supervision standard et la supervision faible, l’intégration de connaissances ontologiques et la sémantique distributionnelle.