HyperAIHyperAI

Command Palette

Search for a command to run...

Étiquetage nominal entier (NER) croisé mono-/multi-source par apprentissage professeur-élève sur des données non étiquetées dans la langue cible

Qianhui Wu; Zijia Lin; Börje F. Karlsson; Jian-Guang Lou; Biqing Huang

Résumé

Pour mieux aborder le problème de reconnaissance d'entités nommées (NER) dans les langues disposant de peu ou pas de données étiquetées, la NER interlinguistique doit efficacement exploiter les connaissances acquises à partir des langues sources dotées de données étiquetées abondantes. Les travaux précédents sur la NER interlinguistique sont principalement basés sur la projection des étiquettes à partir de paires de textes ou sur le transfert direct du modèle. Cependant, ces méthodes ne sont soit pas applicables si les données étiquetées dans les langues sources ne sont pas disponibles, soit ne profitent pas des informations contenues dans les données non étiquetées de la langue cible. Dans cet article, nous proposons une méthode d'apprentissage par enseignant-étudiant pour surmonter ces limitations, où les modèles NER des langues sources servent d'enseignants pour former un modèle étudiant sur des données non étiquetées de la langue cible. La méthode proposée est applicable à la fois pour la NER interlinguistique mono-source et multi-sources. Pour cette dernière, nous proposons en outre une méthode de mesure de similarité afin d'améliorer le pondérage de la supervision provenant des différents modèles enseignants. De nombreuses expériences menées sur 3 langues cibles et des jeux de données de référence montrent que notre méthode surpassent les méthodes existantes les plus performantes pour la NER interlinguistique mono-source et multi-sources.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp