HyperAIHyperAI

Command Palette

Search for a command to run...

XAlign : Alignement et génération factuel-textuel multilingue pour les langues à faibles ressources

Tushar Abhishek Shivprasad Sagare Bhavyajeet Singh Anubhav Sharma Manish Gupta Vasudeva Varma

Résumé

De nombreux scénarios critiques (tels que la génération de texte Wikipedia à partir d’Infoboxes en anglais) nécessitent la génération automatisée de textes descriptifs dans des langues à faible ressource (LR) à partir de triples factuels en anglais. Les travaux antérieurs se sont principalement concentrés sur la génération de texte à partir de faits en anglais (F2T). À notre connaissance, aucune tentative précédente n’avait été faite en matière d’alignement multilingue ou de génération pour les langues à faible ressource. La mise en place d’un système XF2T (génération croisée fait-texte) efficace exige un alignement entre les faits structurés en anglais et les phrases dans les langues à faible ressource. Nous proposons deux méthodes non supervisées pour l’alignement multilingue. Nous introduisons XALIGN, un jeu de données XF2T comprenant 450 000 paires réparties sur 8 langues, dont 5 402 paires ont été annotées manuellement. Nous entraînons également des modèles de génération XF2T de forte performance sur le jeu de données XALIGN.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
XAlign : Alignement et génération factuel-textuel multilingue pour les langues à faibles ressources | Articles | HyperAI