HyperAIHyperAI
il y a 11 jours

Représentations BERT pour l’évaluation automatique de la lisibilité

Joseph Marvin Imperial
Représentations BERT pour l’évaluation automatique de la lisibilité
Résumé

L’évaluation automatique de la lisibilité (ARA) consiste à mesurer le degré de facilité ou de difficulté d’un document texte pour un public cible. Pour les chercheurs, l’un des nombreux problèmes ouverts dans ce domaine réside dans la capacité à rendre les modèles entraînés pour cette tâche performants même pour les langues à faible ressource. Dans cette étude, nous proposons une approche alternative fondée sur l’exploitation combinée des embeddings riches en information fournis par les modèles BERT et des caractéristiques linguistiques conçues manuellement, afin d’améliorer l’évaluation de la lisibilité. Les résultats montrent que la méthode proposée surpasse les approches classiques dans l’évaluation de la lisibilité, sur des jeux de données en anglais et en philippin, avec une amélioration allant jusqu’à 12,4 % en termes de score F1. Nous démontrons également que les informations générales codées dans les embeddings BERT peuvent servir de jeu de caractéristiques de substitution pour les langues à faible ressource comme le philippin, dont les outils NLP sémantiques et syntaxiques sont limités, rendant difficile l’extraction explicite de caractéristiques pour cette tâche.

Représentations BERT pour l’évaluation automatique de la lisibilité | Articles de recherche récents | HyperAI