HyperAIHyperAI
il y a 12 jours

HTSS : Une nouvelle architecture hybride de résumé et de simplification de texte

{Raheel Nawaz, Naif Radi Aljohani, Saeed-Ul Hassan, Matthew Shardlow, Farooq Zaman}
Résumé

La simplification de texte et la résumé automatique sont deux tâches connexes, mais distinctes, dans le domaine de la génération automatique de langage. Alors que le résumé vise à réduire la longueur d’un document tout en préservant son sens original, la simplification cherche à réduire la complexité linguistique du texte. Dans ce travail, nous combinons ces deux tâches grâce à une nouvelle architecture hybride de résumé abstrait et extraitif appelée HTSS. Nous étendons le modèle bien connu pointer generator afin de traiter conjointement la résumé et la simplification. Notre corpus parallèle a été constitué à partir de résumés simplifiés rédigés par des experts domaines et publiés sur le site d’actualités scientifiques EurekaAlert (www.eurekalert.org). Nos résultats montrent que notre modèle HTSS proposé obtient de meilleures performances que la simplification de texte par réseaux neuronaux (NTS) selon le score SARI, et que le résumé abstrait par réseaux neuronaux (ATS) selon le score ROUGE. Nous introduisons également une nouvelle métrique, appelée CSS1, qui combine SARI et ROUGE, et démontrons que notre modèle HTSS surpasse NTS et ATS respectivement de 38,94 % et 53,40 % sur la tâche conjointe de simplification et de résumé. Nous mettons à disposition l’ensemble du code, des modèles et des corpus à la communauté scientifique afin de faciliter les recherches futures à l’adresse suivante : https://github.com/slab-itu/HTSS/.