HyperAIHyperAI
il y a 11 jours

Corpus OneStopEnglish : un nouveau corpus pour l’évaluation automatique de la lisibilité et la simplification de texte

{Ivana Lu{\v{c}}i{\'c}, Sowmya Vajjala}
Corpus OneStopEnglish : un nouveau corpus pour l’évaluation automatique de la lisibilité et la simplification de texte
Résumé

Cet article décrit la collecte et la compilation du corpus OneStopEnglish, composé de textes rédigés à trois niveaux de lecture, et en démontre l'utilité à travers deux applications : l'évaluation automatique de la lisibilité et la simplification automatique des textes. Le corpus comprend 189 textes, chacun disponible en trois versions (soit un total de 567 documents). Il est désormais librement accessible sous licence CC by-SA 4.0, et nous espérons qu'il encouragera des recherches ultérieures sur les sujets de l'évaluation de la lisibilité et de la simplification des textes.

Corpus OneStopEnglish : un nouveau corpus pour l’évaluation automatique de la lisibilité et la simplification de texte | Articles de recherche récents | HyperAI