HyperAIHyperAI

Command Palette

Search for a command to run...

Traducteur sicilien : Une recette pour la TMA à faibles ressources

Eryk Wdowiak

Résumé

Avec 17 000 paires de phrases traduites du sicilien à l'anglais, Arba Sicula a développé le premier traducteur neuronal pour la langue sicilienne. En utilisant de petits vocabulaires de sous-mots, nous avons formé des modèles Transformer de petite taille avec des paramètres de dropout élevés et obtenu des scores BLEU dans les années 20 supérieures. Nous avons ensuite complété notre jeu de données avec des techniques de back-translation et de traduction multilingue, ce qui nous a permis d'améliorer nos scores jusqu'à atteindre la moyenne haute des années 30. Nous attribuons également notre succès à l'intégration d'informations théoriques dans notre jeu de données. Avant la formation, nous avons orienté le vocabulaire de sous-mots vers les désinences que l'on trouve dans un manuel scolaire. De plus, nous avons inclus des exercices tirés de manuels scolaires dans notre jeu de données.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp