Apprentissage méta décomposé pour la reconnaissance de noms propres en peu d'exemples

Les systèmes de reconnaissance d'entités nommées (NER) en peu d'exemples visent à identifier des entités de classes nouvelles à partir d’un nombre très restreint d’exemples étiquetés. Dans cet article, nous proposons une approche décomposée fondée sur l’apprentissage métadonnées, qui aborde le problème de la NER en peu d’exemples en traitant de manière séquentielle la détection de segments en peu d’exemples et le typage d’entités en peu d’exemples grâce à l’apprentissage métadonnées. Plus précisément, nous considérons la détection de segments en peu d’exemples comme un problème d’étiquetage de séquences, et entraînons le détecteur de segments en introduisant l’algorithme MAML (Model-Agnostic Meta-Learning) afin de trouver une bonne initialisation des paramètres du modèle pouvant s’adapter rapidement à de nouvelles classes d’entités. Pour le typage d’entités en peu d’exemples, nous proposons MAML-ProtoNet, c’est-à-dire des réseaux prototypiques améliorés par MAML, afin de découvrir un bon espace d’embeddings permettant de mieux distinguer les représentations des segments textuels provenant de classes d’entités différentes. Des expériences étendues sur diverses bases de données montrent que notre approche obtient des performances supérieures par rapport aux méthodes antérieures.