HyperAIHyperAI
il y a 2 mois

Les Caractéristiques des Entrées Linguistiques Améliorent la Traduction Automatique par Réseaux Neuronaux

Rico Sennrich; Barry Haddow
Les Caractéristiques des Entrées Linguistiques Améliorent la Traduction Automatique par Réseaux Neuronaux
Résumé

La traduction automatique neuronale a récemment obtenu des résultats impressionnants, en utilisant peu d'informations linguistiques externes. Dans cet article, nous montrons que la forte capacité d'apprentissage des modèles de traduction automatique neuronale ne rend pas les caractéristiques linguistiques obsolètes ; elles peuvent être facilement intégrées pour apporter des améliorations supplémentaires aux performances. Nous généralisons la couche d'incrustation (embedding) de l'encodeur dans l'architecture encodeur--décodeur à attention pour prendre en charge l'inclusion de caractéristiques arbitraires, en plus de la caractéristique de mot de base. Nous ajoutons des caractéristiques morphologiques, des étiquettes de classe grammaticale et des labels de dépendance syntaxique comme caractéristiques d'entrée aux systèmes de traduction automatique neuronale anglais<->allemand et anglais->roumain. Dans les expériences menées sur les ensembles d'entraînement et de test WMT16, nous constatons que les caractéristiques linguistiques d'entrée améliorent la qualité du modèle selon trois métriques : perplexité, BLEU et CHRF3. Une implémentation open source de notre système de traduction automatique neuronale est disponible, ainsi que des fichiers et configurations d'exemple.

Les Caractéristiques des Entrées Linguistiques Améliorent la Traduction Automatique par Réseaux Neuronaux | Articles de recherche récents | HyperAI