HyperAIHyperAI

Command Palette

Search for a command to run...

Représentations BERT pour l’évaluation automatique de la lisibilité

Joseph Marvin Imperial

Résumé

L’évaluation automatique de la lisibilité (ARA) consiste à mesurer le degré de facilité ou de difficulté d’un document texte pour un public cible. Pour les chercheurs, l’un des nombreux problèmes ouverts dans ce domaine réside dans la capacité à rendre les modèles entraînés pour cette tâche performants même pour les langues à faible ressource. Dans cette étude, nous proposons une approche alternative fondée sur l’exploitation combinée des embeddings riches en information fournis par les modèles BERT et des caractéristiques linguistiques conçues manuellement, afin d’améliorer l’évaluation de la lisibilité. Les résultats montrent que la méthode proposée surpasse les approches classiques dans l’évaluation de la lisibilité, sur des jeux de données en anglais et en philippin, avec une amélioration allant jusqu’à 12,4 % en termes de score F1. Nous démontrons également que les informations générales codées dans les embeddings BERT peuvent servir de jeu de caractéristiques de substitution pour les langues à faible ressource comme le philippin, dont les outils NLP sémantiques et syntaxiques sont limités, rendant difficile l’extraction explicite de caractéristiques pour cette tâche.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Représentations BERT pour l’évaluation automatique de la lisibilité | Articles | HyperAI