Apprendre à Extraire un Résumé Cohérent par Apprentissage Profond par Renforcement

La cohérence joue un rôle crucial dans la production d'un résumé de haute qualité à partir d'un document. Ces dernières années, le résumé extrait par des méthodes neuronales est devenu de plus en plus attractif. Cependant, la plupart de ces méthodes ignorent la cohérence des résumés lors de l'extraction des phrases. Dans une démarche visant à extraire des résumés cohérents, nous proposons un modèle neuronal de cohérence pour capturer les schémas sémantiques et syntaxiques de cohérence inter-phrases. Le modèle neuronal de cohérence proposé élimine la nécessité d'ingénierie des caractéristiques et peut être formé de manière end-to-end en utilisant des données non étiquetées. Les résultats empiriques montrent que le modèle neuronal de cohérence proposé peut efficacement capturer les schémas de cohérence inter-phrases. En utilisant la sortie combinée du modèle neuronal de cohérence et du package ROUGE comme récompense, nous concevons une méthode d'apprentissage par renforcement pour former un résumeur extrait neuronal proposé, appelé modèle de Résumation Neuronale Extrayante Renforcée (RNES). Le modèle RNES apprend à optimiser simultanément la cohérence et l'importance informative du résumé. Les résultats expérimentaux montrent que le RNES proposé surpasse les lignes de base existantes et atteint des performances de pointe en termes de ROUGE sur l'ensemble de données CNN/Daily Mail. L'évaluation qualitative indique que les résumés produits par RNES sont plus cohérents et lisibles.