HyperAIHyperAI

Command Palette

Search for a command to run...

CipherDAug : Une augmentation de données basée sur le chiffrement pour la traduction automatique par réseaux neuronaux

Nishant Kambhatla Logan Born Anoop Sarkar

Résumé

Nous proposons une nouvelle technique d’augmentation de données pour la traduction automatique neurale fondée sur des cryptogrammes ROT-kkk. Le chiffre ROT-kkk est un chiffre de substitution simple qui remplace une lettre du texte clair par la kkk-ième lettre qui la suit dans l’alphabet. Nous générons d’abord plusieurs cryptogrammes ROT-kkk en utilisant différentes valeurs de kkk sur le texte clair, qui correspond au côté source des données parallèles. Nous exploitons ensuite ces données chiffrées conjointement avec les données parallèles originales via un apprentissage multi-source afin d’améliorer la traduction automatique neurale. Notre méthode, nommée CipherDAug, repose sur une procédure d’entraînement inspirée de la co-régularisation, ne nécessite aucune source externe de données en plus des données d’entraînement initiales, et utilise un modèle Transformer standard pour surpasser significativement des techniques d’augmentation de données puissantes sur plusieurs jeux de données. Cette approche s’intègre aisément aux méthodes existantes d’augmentation de données et obtient des résultats particulièrement prometteurs dans des contextes à faible ressource.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp