Simplification contrôlable de phrases

La simplification de texte vise à rendre un texte plus facile à lire et à comprendre en simplifiant sa grammaire et sa structure tout en préservant fidèlement l’information fondamentale. Elle est souvent considérée comme une tâche générique universelle, où une même simplification conviendrait à tous ; pourtant, divers publics peuvent bénéficier d’un texte simplifié de manières différentes. Nous adaptons un mécanisme de paramétrisation discrète qui permet un contrôle explicite des systèmes de simplification basés sur des modèles Sequence-to-Sequence. En conséquence, les utilisateurs peuvent conditionner les simplifications produites par un modèle selon des attributs tels que la longueur, le degré de reformulation, la complexité lexicale ou la complexité syntaxique. Nous démontrons également que des valeurs soigneusement choisies de ces attributs permettent à des modèles Sequence-to-Sequence standard de surpasser leurs versions classiques sur les benchmarks de simplification. Notre modèle, que nous appelons ACCESS (abréviation de AudienCe-CEntric Sentence Simplification), établit un nouveau record avec un score de 41,87 sur l’ensemble de test WikiLarge, soit une amélioration de +1,42 par rapport au meilleur score précédemment rapporté.