HyperAIHyperAI
il y a 2 mois

Étiquetage nominal entier (NER) croisé mono-/multi-source par apprentissage professeur-élève sur des données non étiquetées dans la langue cible

Qianhui Wu; Zijia Lin; Börje F. Karlsson; Jian-Guang Lou; Biqing Huang
Étiquetage nominal entier (NER) croisé mono-/multi-source par apprentissage professeur-élève sur des données non étiquetées dans la langue cible
Résumé

Pour mieux aborder le problème de reconnaissance d'entités nommées (NER) dans les langues disposant de peu ou pas de données étiquetées, la NER interlinguistique doit efficacement exploiter les connaissances acquises à partir des langues sources dotées de données étiquetées abondantes. Les travaux précédents sur la NER interlinguistique sont principalement basés sur la projection des étiquettes à partir de paires de textes ou sur le transfert direct du modèle. Cependant, ces méthodes ne sont soit pas applicables si les données étiquetées dans les langues sources ne sont pas disponibles, soit ne profitent pas des informations contenues dans les données non étiquetées de la langue cible. Dans cet article, nous proposons une méthode d'apprentissage par enseignant-étudiant pour surmonter ces limitations, où les modèles NER des langues sources servent d'enseignants pour former un modèle étudiant sur des données non étiquetées de la langue cible. La méthode proposée est applicable à la fois pour la NER interlinguistique mono-source et multi-sources. Pour cette dernière, nous proposons en outre une méthode de mesure de similarité afin d'améliorer le pondérage de la supervision provenant des différents modèles enseignants. De nombreuses expériences menées sur 3 langues cibles et des jeux de données de référence montrent que notre méthode surpassent les méthodes existantes les plus performantes pour la NER interlinguistique mono-source et multi-sources.

Étiquetage nominal entier (NER) croisé mono-/multi-source par apprentissage professeur-élève sur des données non étiquetées dans la langue cible | Articles de recherche récents | HyperAI