il y a 11 jours
Corpus OneStopEnglish : un nouveau corpus pour l’évaluation automatique de la lisibilité et la simplification de texte
{Ivana Lu{\v{c}}i{\'c}, Sowmya Vajjala}

Résumé
Cet article décrit la collecte et la compilation du corpus OneStopEnglish, composé de textes rédigés à trois niveaux de lecture, et en démontre l'utilité à travers deux applications : l'évaluation automatique de la lisibilité et la simplification automatique des textes. Le corpus comprend 189 textes, chacun disponible en trois versions (soit un total de 567 documents). Il est désormais librement accessible sous licence CC by-SA 4.0, et nous espérons qu'il encouragera des recherches ultérieures sur les sujets de l'évaluation de la lisibilité et de la simplification des textes.