HyperAIHyperAI

Command Palette

Search for a command to run...

La Distance Géographique est le Nouveau Hyperparamètre : Une Étude de Cas pour la Recherche de la Langue Pré-entraînée Optimale pour la Traduction Automatique Anglais-isiZulu

Muhammad Umair Nasir; Innocent Amos Mchechesi

Résumé

En raison de la disponibilité limitée de jeux de données et de ressources textuelles pour les langues à faibles ressources comme l'isiZulu, il existe un besoin considérable d'exploiter les connaissances issues des modèles pré-entraînés afin d'améliorer la traduction automatique à faibles ressources. De plus, le manque de techniques pour gérer les complexités des langues morphologiquement riches a exacerbé le développement inégal des modèles de traduction, laissant nombreuses langues africaines largement parlées en arrière. Cette étude explore les avantages potentiels du transfert d'apprentissage dans un cadre de traduction anglais-isiZulu. Les résultats montrent la valeur du transfert d'apprentissage à partir de langues apparentées pour améliorer les performances des modèles de traduction à faibles ressources, offrant ainsi une stratégie clé pour la traduction à faibles ressources à l'avenir. Nous avons recueilli des résultats provenant de 8 différents corpus linguistiques, dont un corpus multilingue, et constaté que le modèle isiXhosa-isiZulu surpassait toutes les autres langues, avec un score BLEU de 8,56 sur l'ensemble de test, soit une amélioration de 2,73 par rapport au modèle pré-entraîné sur le corpus multilingue. Nous avons également établi un nouveau coefficient, le Coefficient Géographique de Nasir (Nasir's Geographical Distance Coefficient - NGDC), qui facilite la sélection des langues pour les modèles pré-entraînés. Le NGDC a également indiqué que l'isiXhosa devrait être sélectionnée comme langue pour le modèle pré-entraîné.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
La Distance Géographique est le Nouveau Hyperparamètre : Une Étude de Cas pour la Recherche de la Langue Pré-entraînée Optimale pour la Traduction Automatique Anglais-isiZulu | Articles | HyperAI