Analyse conjointe et génération pour la synthèse abstraite

Les phrases produites par les systèmes de résumé abstrait peuvent être grammaticalement incorrectes et échouer à préserver les sens originaux, malgré une fluidité locale. Dans cet article, nous proposons de résoudre ce problème en générant simultanément une phrase et son analyse syntaxique (parse de dépendances) tout en effectuant l’abstraction. Si la génération d’un mot peut introduire une relation erronée dans le résumé, ce comportement doit être découragé. La méthode proposée s’annonce donc prometteuse pour produire des phrases grammaticalement correctes et favoriser la fidélité du résumé au contenu original. Nos contributions sont doubles. Premièrement, nous présentons une nouvelle architecture neuronale pour le résumé abstrait, combinant de manière synchronisée un décodeur séquentiel et un décodeur basé sur un arbre afin de générer à la fois une phrase de résumé et son analyse syntaxique. Deuxièmement, nous décrivons un nouveau protocole d’évaluation humaine permettant d’évaluer si, et dans quelle mesure, un résumé conserve les sens originaux. Nous évaluons notre méthode sur plusieurs jeux de données de résumé et démontrons des résultats compétitifs par rapport à des modèles de référence robustes.