HyperAIHyperAI
il y a 11 jours

Une étude comparative des types de caractéristiques pour la classification de texte basée sur l’âge

Anna Glazkova, Yury Egorov, Maksim Glazkov
Une étude comparative des types de caractéristiques pour la classification de texte basée sur l’âge
Résumé

La capacité à déterminer automatiquement le public cible par âge d’un roman ouvre de nombreuses perspectives pour le développement d’outils de recherche d’information. En premier lieu, les développeurs de systèmes de recommandation de livres et de bibliothèques électroniques pourraient s’intéresser à filtrer les textes selon l’âge du lecteur le plus probable. Ensuite, les parents pourraient souhaiter sélectionner des œuvres littéraires adaptées à leurs enfants. Enfin, cette capacité serait utile aux auteurs et aux éditeurs pour identifier les caractéristiques qui influencent la pertinence d’un texte pour un public jeune. Dans cet article, nous comparons l’efficacité empirique de divers types de caractéristiques linguistiques pour la classification des textes de fiction en fonction de l’âge. À cette fin, nous avons constitué un corpus de textes issus de résumés de livres, étiquetés selon l’une des deux catégories : enfant ou adulte. Nous avons évalué les types de caractéristiques suivants : indices de lisibilité, sentiment, lexicalité, grammaire, caractéristiques générales et attributs liés à la publication. Les résultats obtenus montrent que les caractéristiques décrivant le texte au niveau du document peuvent considérablement améliorer la qualité des modèles d’apprentissage automatique.

Une étude comparative des types de caractéristiques pour la classification de texte basée sur l’âge | Articles de recherche récents | HyperAI