HyperAIHyperAI
il y a 11 jours

Pousser l’évaluation de la lisibilité du texte : un Transformer associé à des caractéristiques linguistiques manuelles

Bruce W. Lee, Yoo Sung Jang, Jason Hyung-Jong Lee
Pousser l’évaluation de la lisibilité du texte : un Transformer associé à des caractéristiques linguistiques manuelles
Résumé

Nous rapportons deux améliorations essentielles dans l’évaluation de la lisibilité : 1. l’introduction de trois nouvelles caractéristiques fondées sur une sémantique avancée, et 2. des preuves opportunes démontrant que les modèles d’apprentissage automatique traditionnels (par exemple, Forêt Aléatoire, utilisant des caractéristiques manuelles) peuvent être combinés avec des modèles à transformateurs (par exemple, RoBERTa) afin d’améliorer significativement les performances. Premièrement, nous explorons des transformateurs appropriés ainsi que des modèles d’apprentissage automatique traditionnels. Ensuite, nous extrayons 255 caractéristiques linguistiques manuelles à l’aide d’un logiciel d’extraction développé spécifiquement pour cette étude. Enfin, nous combinons ces éléments pour construire plusieurs modèles hybrides, atteignant ainsi une précision de pointe (SOTA) sur des jeux de données populaires dans le domaine de l’évaluation de la lisibilité. L’utilisation de caractéristiques manuelles s’avère particulièrement bénéfique pour les jeux de données de petite taille. Notamment, notre modèle hybride RoBERTa-RF-T1 atteint une précision de classification quasi-parfaite de 99 %, soit une amélioration de 20,3 % par rapport à l’état de l’art précédent.

Pousser l’évaluation de la lisibilité du texte : un Transformer associé à des caractéristiques linguistiques manuelles | Articles de recherche récents | HyperAI