AMÉLIORER LA RÉSUMÉ ABSTRAIT AVEC UN AUGMENTATION PAR SEGMENT ET UNE CONSCIENCE DE POSITION (ACLing2021)
La détection des relations entre les phrases afin d’en extraire l’information essentielle constitue toujours une véritable affaire d’art dans la synthèse abstraite de texte. Dans ce travail, nous présentons une version améliorée du système extracteur-abstraiteur appelée SEGMENT, dans laquelle l’extracteur identifie les mots et les expressions inclus dans le résumé cible, tandis que l’abstraiteur exploite ces caractéristiques pour générer un résumé fluide. Nous introduisons une couche d’embedding de segments afin de richer l’information disponible pour l’abstraiteur, ce qui renforce la cohésion entre les phrases. Dans l’extracteur, nous combinons un mécanisme de filtrage avec une prise en compte de la position afin d’améliorer la qualité de la sélection d’information. Notre méthode montre des améliorations prometteuses sur le jeu de données CNN/DM, dépassant les états de l’art de 5,1 % en ROUGE-1 et de 5 % en ROUGE-2.