Échos d'Alexandrie : Une grande ressource pour la résumé multilingue de livres

Ces dernières années, la recherche en résumé de texte s’est principalement concentrée sur le domaine des actualités, où les textes sont généralement courts et présentent des caractéristiques de mise en page marquées. La tâche du résumé complet d’un livre soulève des défis supplémentaires, difficiles à relever avec les ressources actuelles, en raison de leur taille limitée et de leur disponibilité uniquement en anglais. Pour surmonter ces limitations, nous présentons « Echoes from Alexandria », ou, sous sa forme abrégée, « Echoes », une ressource étendue dédiée au résumé multilingue de livres. Echoes comprend trois nouveaux jeux de données : i) Echo-Wiki, pour le résumé multilingue de livres, ii) Echo-XSum, pour un résumé extrêmement condensé en multilingue, et iii) Echo-FairySum, pour le résumé extraitif de livres. À notre connaissance, Echoes, avec ses milliers de livres et de résumés, constitue la plus grande ressource disponible à ce jour, et la première à être multilingue, incluant cinq langues et vingt-cinq paires de langues. En complément d’Echoes, nous introduisons également une nouvelle base hybride, combinant une approche extraitive suivie d’une abstraite, et, sur la base de nos résultats expérimentaux ainsi que d’une analyse manuelle des résumés générés, nous soutenons que cette approche est plus adaptée au résumé de livres que les méthodes purement abstraites. Nous mettons à disposition notre ressource et notre logiciel à l’adresse suivante : https://github.com/Babelscape/echoes-from-alexandria, dans l’espoir de stimuler des recherches innovantes dans le domaine du résumé multilingue de livres.