Résumé rapide et abstrait avec réécriture de phrases sélectionnées par renforcement

Inspirationnée par la manière dont les humains résument de longs documents, nous proposons un modèle de résumé précis et rapide qui sélectionne d'abord des phrases salientes avant de les réécrire de manière abstraite (c'est-à-dire, compresse et paraphrase) pour générer un résumé global concis. Nous utilisons une nouvelle méthode de gradient de politique au niveau des phrases pour relier le calcul non différentiable entre ces deux réseaux neuronaux de manière hiérarchique, tout en maintenant la fluidité du langage. Sur le plan empirique, nous atteignons le nouveau niveau d'état de l'art sur tous les critères (y compris l'évaluation par des humains) sur l'ensemble de données CNN/Daily Mail, ainsi que des scores d'abstractivité significativement plus élevés. De plus, en opérant d'abord au niveau des phrases puis au niveau des mots, nous permettons un décodage parallèle de notre modèle génératif neuronal, ce qui entraîne une vitesse d'inférence considérablement plus rapide (10 à 20 fois) et une convergence d'apprentissage 4 fois plus rapide que celle des modèles encodeur-décodeur précédents pour les paragraphes longs. Nous démontrons également la généralisation de notre modèle sur l'ensemble de données DUC-2002 (test uniquement), où nous obtenons des scores supérieurs à ceux d'un modèle d'état de l'art.