HyperAIHyperAI
il y a 2 mois

Traduction syntaxique améliorée de la traduction neuronale avec des représentations de mots sensibles à la syntaxe

Meishan Zhang; Zhenghua Li; Guohong Fu; Min Zhang
Traduction syntaxique améliorée de la traduction neuronale avec des représentations de mots sensibles à la syntaxe
Résumé

La syntaxe a été démontrée comme étant hautement efficace dans la traduction automatique neuronale (NMT). Les modèles de NMT précédents intègrent la syntaxe en représentant les meilleurs arbres (1-best tree) issus d'un système de parsing bien entraîné, par exemple les méthodes représentatives Tree-RNN et Tree-Linearization, qui peuvent souffrir d'une propagation d'erreurs. Dans ce travail, nous proposons une nouvelle méthode pour intégrer implicitement la syntaxe du côté source dans la NMT. L'idée de base est d'utiliser les représentations cachées intermédiaires d'un analyseur de dépendances bien entraîné, qui sont appelées des représentations de mots sensibles à la syntaxe (syntax-aware word representations, SAWRs). Ensuite, nous concaténons simplement ces SAWRs avec des plongements de mots ordinaires pour améliorer les modèles de NMT basiques. La méthode peut être intégrée directement dans les modèles de NMT sequence-to-sequence (Seq2Seq) largement utilisés. Nous commençons par un système de référence basé sur les RNN pour Seq2Seq, et nous testons l'efficacité de notre méthode proposée sur deux jeux de données de référence pour les tâches de traduction chinois-anglais et anglais-vietnamien, respectivement. Les résultats expérimentaux montrent que l'approche proposée permet d'apporter des améliorations significatives des scores BLEU sur les deux jeux de données par rapport au modèle de base : 1,74 point pour la traduction chinois-anglais et 0,80 point pour la traduction anglais-vietnamien, respectivement. De plus, cette approche surpass également les méthodes explicites Tree-RNN et Tree-Linearization.

Traduction syntaxique améliorée de la traduction neuronale avec des représentations de mots sensibles à la syntaxe | Articles de recherche récents | HyperAI