Lecture comme HER : Résumé extrait inspiré par la lecture humaine

Dans ce travail, nous réexaminons le problème de la synthèse de texte extraitive pour les documents longs. Nous observons que le processus humain d'extraction d'informations peut être divisé en deux étapes : 1) une première lecture rapide visant à repérer des informations sommaires, et 2) une lecture plus attentive ultérieure permettant de sélectionner les phrases clés afin de constituer le résumé. En simulant ce processus en deux étapes, nous proposons une nouvelle approche pour la synthèse extraitive. Nous formulons ce problème comme un problème de bandit contextuel et le résolvons à l’aide d’une méthode de gradient de politique. Nous utilisons un réseau de neurones convolutif pour encoder les idées principales des paragraphes lors de la lecture rapide, et un mécanisme de décision doté d’un mécanisme d’arrêt adapté pour la lecture attentive. Des expériences menées sur les jeux de données CNN et DailyMail montrent que notre méthode permet de générer des résumés de qualité élevée, de longueur variable, et s’impose nettement aux méthodes extraitives de pointe en termes de scores ROUGE.