Command Palette
Search for a command to run...
Traduction neuronale par apprentissage conjoint de l'alignement et de la traduction
Traduction neuronale par apprentissage conjoint de l'alignement et de la traduction
Dzmitry Bahdanau KyungHyun Cho Yoshua Bengio
Résumé
La traduction automatique neuronale est une approche récemment proposée dans le domaine de la traduction automatique. Contrairement à la traduction statistique traditionnelle, la traduction automatique neuronale vise à construire un seul réseau neuronal qui peut être ajusté conjointement pour maximiser les performances de traduction. Les modèles récemment proposés pour la traduction automatique neuronale appartiennent souvent à la famille des encodeurs-décodageurs et consistent en un encodeur qui transforme une phrase source en un vecteur de longueur fixe, à partir duquel un décodeur génère une traduction. Dans cet article, nous supposons que l'utilisation d'un vecteur de longueur fixe constitue une bouteille d'encolure dans l'amélioration des performances de cette architecture d'encodeur-décodageur de base, et nous proposons d'étendre cela en permettant au modèle de rechercher automatiquement (de manière « douce ») les parties d'une phrase source pertinentes pour prédire un mot cible, sans avoir besoin de former explicitement ces parties comme des segments rigides. Avec cette nouvelle approche, nous obtenons des performances de traduction comparables aux systèmes existants basés sur les phrases et considérés comme l'état de l'art pour la tâche de traduction anglais-français. De plus, l'analyse qualitative montre que les alignements (« doux ») trouvés par le modèle sont en accord avec notre intuition.