Vers la traduction automatique neuronale basée sur les phrases

Dans cet article, nous présentons la Traduction automatique neuronale par phrases (Neural Phrase-based Machine Translation, NPMT). Notre méthode modélise explicitement les structures de phrases dans les séquences de sortie en utilisant des Réseaux Dormir-Réveiller (Sleep-Wake Networks, SWAN), une méthode récemment proposée pour le modèle de séquence basé sur la segmentation. Pour atténuer l'exigence d'alignement monotone des SWAN, nous introduisons une nouvelle couche permettant de réaliser un réordonnancement local (doux) des séquences d'entrée. Contrairement aux approches existantes de traduction automatique neuronale (Neural Machine Translation, NMT), la NPMT ne fait pas usage de mécanismes de décodage basés sur l'attention. Au lieu de cela, elle produit directement des phrases dans un ordre séquentiel et peut décoder en temps linéaire. Nos expériences montrent que la NPMT obtient des performances supérieures sur les tâches de traduction automatique IWSLT 2014 allemand-anglais/anglais-allemand et IWSLT 2015 anglais-vietnamien par rapport à des bases solides de NMT. Nous constatons également que notre méthode génère des phrases significatives dans les langues de sortie.