HyperAIHyperAI
il y a 2 mois

Projection de Labels Facilement Frustrante pour le Transfert Interlinguistique

Yang Chen; Chao Jiang; Alan Ritter; Wei Xu
Projection de Labels Facilement Frustrante pour le Transfert Interlinguistique
Résumé

La traduction des données d'entraînement dans de nombreuses langues est apparue comme une solution pratique pour améliorer le transfert interlinguistique. Pour les tâches impliquant des annotations au niveau des segments, telles que l'extraction d'information ou la réponse à des questions, une étape supplémentaire de projection d'étiquettes est nécessaire pour mapper les segments annotés sur les textes traduits. Récemment, quelques travaux ont utilisé une méthode simple de marquage puis de traduction pour effectuer conjointement la traduction et la projection en insérant des marqueurs spéciaux autour des segments étiquetés dans la phrase originale. Cependant, à notre connaissance, aucune analyse empirique n'a été menée sur la façon dont cette approche se compare aux méthodes traditionnelles de projection d'annotations basées sur l'alignement de mots. Dans cet article, nous présentons une étude empirique approfondie couvrant 57 langues et trois tâches (réponse à des questions (QA), reconnaissance d'entités nommées (NER) et extraction d'événements) pour évaluer l'efficacité et les limites des deux méthodes, comblant ainsi un important vide dans la littérature. Les résultats expérimentaux montrent que notre version optimisée du marquage puis de traduction, que nous appelons EasyProject, s'applique facilement à de nombreuses langues et fonctionne avec une efficacité surprenante, surpassant les méthodes plus complexes basées sur l'alignement de mots. Nous analysons plusieurs facteurs clés qui influencent les performances finales des tâches et montrons que EasyProject fonctionne bien car elle peut préserver avec précision les limites des segments étiquetés après la traduction. Nous rendrons publiquement disponibles tout notre code et nos données.

Projection de Labels Facilement Frustrante pour le Transfert Interlinguistique | Articles de recherche récents | HyperAI