HyperAIHyperAI
il y a 2 mois

Un modèle de séquence à séquence convolutionnel renforcé et sensible aux sujets pour la synthèse textuelle abstraite

Li Wang; Junlin Yao; Yunzhe Tao; Li Zhong; Wei Liu; Qiang Du
Un modèle de séquence à séquence convolutionnel renforcé et sensible aux sujets pour la synthèse textuelle abstraite
Résumé

Dans cet article, nous proposons une approche d'apprentissage profond pour aborder les tâches de résumé automatique en intégrant des informations thématiques dans le modèle de séquence à séquence par convolution (ConvS2S) et en utilisant l'entraînement séquentiel auto-critique (SCST) pour l'optimisation. Grâce à l'attention conjointe aux thèmes et à l'alignement au niveau des mots, notre méthode peut améliorer la cohérence, la diversité et l'information des résumés générés via un mécanisme de génération de probabilités biaisées. Par ailleurs, l'entraînement par renforcement, tel que SCST, optimise directement le modèle proposé par rapport à la métrique non différentiable ROUGE, ce qui évite également le biais d'exposition pendant l'inférence. Nous menons une évaluation expérimentale comparative avec les méthodes de pointe sur les jeux de données Gigaword, DUC-2004 et LCSTS. Les résultats empiriques démontrent la supériorité de notre méthode proposée dans le résumé abstrait.

Un modèle de séquence à séquence convolutionnel renforcé et sensible aux sujets pour la synthèse textuelle abstraite | Articles de recherche récents | HyperAI