Réseau de pointeurs de concept pour la synthèse abstraite

Un résumé abstrait de qualité ne doit pas se contenter de copier les éléments saillants du texte source, mais doit également tendre à générer de nouveaux mots conceptuels afin d’exprimer des détails concrets. Inspiré par le modèle séquence-à-séquence populaire appelé pointer generator, ce papier présente un réseau de pointeurs conceptuels visant à améliorer ces aspects de la synthèse abstraite. Ce réseau exploite des conceptualisations fondées sur des connaissances et sensibles au contexte afin d’obtenir un ensemble étendu de concepts candidats. Le modèle sélectionne alors le choix le plus approprié en combinant cet ensemble de concepts et le texte source original. Cette approche conjointe permet de produire des résumés abstraits enrichis de concepts sémantiques de niveau supérieur. Le modèle d’entraînement est également optimisé de manière à s’adapter à différents jeux de données, grâce à une méthode novatrice d’apprentissage à supervision distante guidée par des résumés de référence et l’ensemble de test. Globalement, l’approche proposée obtient des améliorations statistiquement significatives par rapport à plusieurs modèles de pointe sur les jeux de données DUC-2004 et Gigaword. Une évaluation humaine des capacités abstraites du modèle confirme également la qualité des résumés générés dans ce cadre.