Résumé extraictif de documents longs en combinant le contexte global et local

Dans cet article, nous proposons un nouveau modèle neuronal de synthèse extraitive pour documents uniques longs, intégrant à la fois le contexte global de l'ensemble du document et le contexte local au sein du sujet traité. Nous évaluons ce modèle sur deux jeux de données de publications scientifiques, Pubmed et arXiv, où il surpasser les approches antérieures, tant extraitives qu'abstraitives, en termes de scores ROUGE-1, ROUGE-2 et METEOR. Nous montrons également que, conformément à notre objectif, les avantages de notre méthode s'accentuent progressivement avec la longueur des documents. De manière surprenante, une étude d'ablation indique que les bénéfices de notre modèle semblent provenir exclusivement de la modélisation du contexte local, même pour les documents les plus longs.