HyperAIHyperAI
il y a 16 jours

GoSum : Résumé extrait de documents longs par apprentissage par renforcement et état discursif organisé en graphe

Junyi Bian, Xiaodi Huang, Hong Zhou, Shanfeng Zhu
GoSum : Résumé extrait de documents longs par apprentissage par renforcement et état discursif organisé en graphe
Résumé

L’extraction de résumés à partir de documents longs peut être considérée comme une classification de phrases utilisant les informations structurelles du document. L’utilisation de ces informations structurelles pour résumer un document reste un défi. Dans cet article, nous proposons GoSum, un nouveau modèle extraitif basé sur les graphes et l’apprentissage par renforcement pour la résumation de documents scientifiques longs. Plus précisément, GoSum encode les états des phrases dans un cadre d’apprentissage par renforcement en construisant un graphe hétérogène pour chaque document d’entrée à différents niveaux discursifs. Une arête dans ce graphe reflète la hiérarchie discursive du document, permettant de limiter les dérives sémantiques aux frontières entre sections. Nous évaluons GoSum sur deux jeux de données de résumation d’articles scientifiques : PubMed et arXiv. Les résultats expérimentaux démontrent que GoSum atteint des performances de pointe par rapport aux modèles extraitifs et abstraitifs les plus performants. Des études d’ablation confirment en outre que les performances de GoSum s’améliorent grâce à l’exploitation des informations discursives.

GoSum : Résumé extrait de documents longs par apprentissage par renforcement et état discursif organisé en graphe | Articles de recherche récents | HyperAI