Aller à l'essentiel : Résumé avec des réseaux de pointeurs-générateurs

Les modèles de séquence à séquence neuronaux ont fourni une nouvelle approche viable pour la synthèse textuelle abstraite (ce qui signifie qu'ils ne sont pas limités à simplement sélectionner et réorganiser des passages du texte original). Cependant, ces modèles présentent deux inconvénients : ils sont susceptibles de reproduire les détails factuels de manière inexacte, et ils ont tendance à se répéter. Dans cette étude, nous proposons une architecture novatrice qui améliore le modèle de séquence à séquence attentionnel standard de deux manières orthogonales. Premièrement, nous utilisons un réseau hybride pointeur-générateur qui peut copier des mots du texte source par pointage, ce qui favorise la reproduction précise des informations, tout en conservant la capacité de produire des mots nouveaux grâce au générateur. Deuxièmement, nous utilisons la couverture pour suivre ce qui a déjà été résumé, ce qui décourage les répétitions. Nous appliquons notre modèle à la tâche de synthèse des articles du CNN / Daily Mail, surpassant l'état actuel de l'art en synthèse abstraite d'au moins 2 points ROUGE.