Traduction non supervisée de la machine neuronale avec partage des poids

La traduction automatique neuronale non supervisée (NMT) est une approche récemment proposée dans le domaine de la traduction automatique, visant à entraîner un modèle sans utiliser de données étiquetées. Les modèles conçus pour la NMT non supervisée utilisent souvent un seul encodeur partagé pour mapper les paires de phrases provenant de différentes langues vers un espace latent commun, ce qui s'avère inefficace pour préserver les caractéristiques uniques et internes de chaque langue, telles que le style, le vocabulaire et la structure des phrases. Pour remédier à ce problème, nous introduisons une extension en utilisant deux encodeurs indépendants tout en partageant certaines parties des poids responsables de l'extraction des représentations de haut niveau des phrases d'entrée. De plus, deux réseaux génératifs adverses (GANs) différents sont proposés pour améliorer la traduction interlinguistique : le GAN local et le GAN global. Grâce à cette nouvelle approche, nous obtenons des améliorations significatives sur les tâches de traduction anglais-allemand, anglais-français et chinois-anglais.