il y a 13 jours
L'impact du traitement lexical et grammatical sur la génération de code à partir d'un langage naturel
Nathanaël Beau, Benoît Crabbé

Résumé
En tenant compte de l'architecture seq2seq de TranX pour la traduction du langage naturel en code, nous identifions quatre composants essentiels : les contraintes grammaticales, le prétraitement lexical, les représentations d'entrée et les mécanismes de copie. Afin d'étudier l'impact de ces composants, nous utilisons une architecture de pointe fondée sur un encodeur BERT et un décodeur basé sur une grammaire, pour lequel une formalisation est fournie. L'article met en évidence l'importance du composant de substitution lexicale dans les systèmes actuels de traduction du langage naturel en code.