HyperAIHyperAI
il y a 18 jours

HEProto : Un ProtoNet hiérarchique amélioré basé sur l’apprentissage multi-tâches pour la reconnaissance de noms propres en peu d’exemples

{Enhong Chen, Yi Zheng, Tong Xu, Pengfei Luo, Lili Zhao, Wei Chen}
Résumé

La tâche de reconnaissance de nom propre (NER) en peu d'exemples, qui vise à identifier et classer des entités provenant de domaines divers à partir d’un nombre limité d’exemples d’apprentissage, est depuis longtemps considérée comme une étape fondamentale dans la construction de graphes de connaissances (KG). Des efforts considérables ont été fournis pour cette tâche, aboutissant à des performances compétitives ; toutefois, ces approches traitent généralement les deux sous-tâches — la détection des spans et la classification des types — comme indépendantes l’une de l’autre, négligeant ainsi l’intégrité et les corrélations entre elles. En outre, les méthodes antérieures peinent souvent à intégrer efficacement les caractéristiques à grande échelle (coarse-grained) des entités, entraînant une représentation sémantique insuffisante des types d’entités. À cet effet, dans cet article, nous proposons un modèle appelé HEProto (Hierarchical Enhancing ProtoNet), fondé sur l’apprentissage multi-tâches, afin d’apprendre conjointement ces deux sous-tâches et de modéliser leurs corrélations. Plus précisément, nous utilisons l’apprentissage contrastif pour renforcer les informations relatives aux bornes des spans et les représentations sémantiques des types dans les deux sous-tâches. Ensuite, nous concevons un réseau prototypique hiérarchique afin d’exploiter les informations à grande échelle des entités lors de la phase de classification des types, ce qui permet au modèle d’apprendre de manière plus efficace des représentations sémantiques fines. Parallèlement, nous introduisons une fonction de perte basée sur une marge de similarité afin de réduire la similarité entre les entités fines et les prototypes grossiers non pertinents. Enfin, des expérimentations étendues sur le jeu de données Few-NERD montrent que notre approche surpasser les méthodes de référence. Le code source de HEProto est disponible à l’adresse suivante : https://github.com/fanshu6hao/HEProto.