HyperAIHyperAI
il y a 11 jours

Entraînement au niveau de résumé pour la reformulation de phrases en vue de la synthèse abstraite

Sanghwan Bae, Taeuk Kim, Jihoon Kim, Sang-goo Lee
Entraînement au niveau de résumé pour la reformulation de phrases en vue de la synthèse abstraite
Résumé

Dans une tentative de combiner la résumé par extraction et la résumé par abstraction, les modèles de reformulation de phrases adoptent une stratégie consistant à extraire d’abord les phrases les plus pertinentes d’un document, puis à reformuler ces phrases sélectionnées afin de générer un résumé. Toutefois, les modèles existants dans ce cadre s’appuient principalement sur des récompenses au niveau des phrases ou sur des étiquettes sous-optimales, ce qui entraîne un désalignement entre l’objectif d’apprentissage et les métriques d’évaluation. Dans cet article, nous proposons un nouveau signal d’apprentissage qui maximise directement les scores ROUGE au niveau du résumé grâce à l’apprentissage par renforcement. Par ailleurs, nous intégrons BERT dans notre modèle, exploitant pleinement ses capacités en compréhension du langage naturel. Dans des expériences étendues, nous démontrons qu’une combinaison de notre modèle proposé et de notre procédure d’apprentissage atteint de nouvelles performances de pointe sur les jeux de données CNN/Daily Mail et New York Times. Nous montrons également que notre approche se généralise mieux sur le jeu de test DUC-2002.

Entraînement au niveau de résumé pour la reformulation de phrases en vue de la synthèse abstraite | Articles de recherche récents | HyperAI