Optimisation de la traduction automatique statistique pour la simplification de texte

Les systèmes récents de simplification de texte s'appuient sur des modèles de traduction automatique basiques afin d'apprendre des paraphrases lexicales et syntaxiques à partir d'un corpus parallèle manuellement simplifié. Ces approches sont limitées par la qualité et la quantité des corpus manuels, qui sont coûteux à construire. Dans cet article, nous menons une adaptation approfondie de la traduction automatique statistique pour réaliser la simplification de texte, en tirant parti de grandes quantités de paraphrases apprises à partir de textes bilingues et d'un petit nombre de simplifications manuelles comportant plusieurs références. Notre travail constitue la première tentative de conception de métriques automatiques efficaces pour l'ajustement et l'évaluation des systèmes de simplification, ce qui facilitera le développement itératif de cette tâche.