Traduction non supervisée de machines neuronales initialisée par la traduction statistique non supervisée

Des travaux récents ont obtenu des résultats remarquables dans l'entraînement de systèmes de traduction automatique neuronale (NMT) de manière entièrement non supervisée, en utilisant de nouvelles architectures dédiées qui s'appuient uniquement sur des corpus monolingues. Dans ce travail, nous proposons de définir la traduction automatique neuronale non supervisée (UNMT) comme une NMT entraînée avec la supervision de données bilingues synthétiques. Notre approche permet directement d'utiliser les architectures d'avant-garde proposées pour la NMT supervisée en remplaçant les données bilingues créées par des humains par des données bilingues synthétiques pour l'entraînement. Nous proposons d'initialiser l'entraînement de l'UNMT avec des données bilingues synthétiques générées par la traduction statistique automatique non supervisée (USMT). Le système UNMT est ensuite amélioré progressivement à l'aide de la rétrotraduction. Nos expériences préliminaires montrent que notre approche atteint un nouveau niveau d'avant-garde pour la traduction automatique non supervisée sur la tâche de traduction de nouvelles allemand-anglais du WMT16, dans les deux directions de traduction.