Intégration des Transformers et des Règles de Paraphrase pour la Simplification des Phrases

La simplification de phrases vise à réduire leur complexité tout en conservant leur sens original. Les modèles actuels de simplification de phrases ont adopté des idées issues des études sur la traduction automatique et ont appris implicitement des règles de simplification à partir de paires de phrases normales-simples. Dans cet article, nous explorons un nouveau modèle basé sur une architecture d'attention à plusieurs couches et têtes, et nous proposons deux approches innovantes pour intégrer le Simple PPDB (une base de connaissances de paraphrases pour la simplification couvrant un large éventail de règles de simplification réelles). Les expériences montrent que cette intégration offre deux avantages majeurs : (1) le modèle intégré surpasses plusieurs modèles de référence pour la simplification de phrases mentionnés dans la littérature ; (2) par l'analyse de l'utilisation des règles, le modèle tend à sélectionner des règles de simplification plus précises. Le code et les modèles utilisés dans cet article sont disponibles sur https://github.com/Sanqiang/text_simplification.