Amélioration de la synthèse abstraite de documents neurale par régularisation structurelle

Les modèles récents de séquence à séquence basés sur les réseaux neuronaux ont montré des progrès significatifs dans la synthèse de textes courts. Toutefois, pour la synthèse de documents, ils échouent à capturer la structure à long terme tant des documents que des résumés composés de plusieurs phrases, ce qui entraîne une perte d’information et des répétitions. Dans cet article, nous proposons d’exploiter les informations structurelles tant des documents que des résumés multi-phrases afin d’améliorer les performances de la synthèse de documents. Plus précisément, nous intégrons à la fois une régularisation par compression structurelle et une régularisation par couverture structurelle dans le processus de synthèse, afin de capturer les propriétés de compression d’information et de couverture d’information, qui constituent les deux caractéristiques structurelles les plus importantes de la synthèse de documents. Les résultats expérimentaux démontrent que la régularisation structurelle améliore de manière significative les performances de la synthèse de documents, permettant à notre modèle de générer des résumés plus informatifs et plus concis, et permettant ainsi de surpasser de façon notable les méthodes abstraitives neuronales les plus avancées.