HyperAIHyperAI
il y a 11 jours

Caractéristiques linguistiques pour l’évaluation de la lisibilité

Tovly Deutsch, Masoud Jasbi, Stuart Shieber
Caractéristiques linguistiques pour l’évaluation de la lisibilité
Résumé

L’évaluation de la lisibilité vise à classer automatiquement un texte selon le niveau de difficulté adapté aux lecteurs en apprentissage. Les approches traditionnelles de cette tâche s’appuient sur une variété de caractéristiques motivées par la linguistique, combinées à des modèles d’apprentissage automatique simples. Des méthodes plus récentes ont amélioré les performances en abandonnant ces caractéristiques au profit de modèles d’apprentissage profond. Toutefois, il reste inconnu si l’ajout de caractéristiques linguistiquement motivées aux modèles d’apprentissage profond pourrait améliorer davantage les performances. Ce papier combine ces deux approches dans le but d’améliorer les performances globales du modèle et de répondre à cette question. En évaluant sur deux grandes corpora de lisibilité, nous constatons qu’avec une quantité suffisante de données d’entraînement, l’ajout de caractéristiques linguistiquement motivées aux modèles d’apprentissage profond ne permet pas d’améliorer les performances de l’état de l’art. Nos résultats fournissent des preuves préliminaires à l’hypothèse selon laquelle les modèles d’apprentissage profond d’avant-garde captent déjà des caractéristiques linguistiques du texte liées à la lisibilité. Des recherches futures sur la nature des représentations formées au sein de ces modèles pourraient éclairer les caractéristiques apprises et leurs relations avec celles supposées dans les approches traditionnelles fondées sur la linguistique.

Caractéristiques linguistiques pour l’évaluation de la lisibilité | Articles de recherche récents | HyperAI