HyperAIHyperAI

Command Palette

Search for a command to run...

PEGASUS : Pré-entraînement avec des phrases extraites contenant des trous pour la synthèse abstraite

Jingqing Zhang Yao Zhao Mohammad Saleh Peter J. Liu

Résumé

Les travaux récents portant sur l’entraînement préalable des modèles Transformer par des objectifs auto-supervisés sur de grandes corpora de texte ont démontré un succès remarquable lorsqu’ils sont affinés sur des tâches NLP en aval, notamment la résumé abstrait de texte. Toutefois, les objectifs d’entraînement préalable spécifiquement conçus pour le résumé abstrait de texte n’ont pas encore été explorés de manière systématique. En outre, l’évaluation systématique à travers des domaines divers reste insuffisante. Dans ce travail, nous proposons d’entraîner préalablement de grands modèles encodage-décodage basés sur Transformer sur de vastes corpora de texte, en introduisant un nouvel objectif auto-supervisé. Dans PEGASUS, des phrases importantes sont supprimées ou masquées à partir d’un document d’entrée, puis reconstruites conjointement comme une seule séquence de sortie à partir des phrases restantes, ce qui rappelle le principe d’un résumé extrait. Nous avons évalué notre meilleur modèle PEGASUS sur 12 tâches de résumé en aval couvrant divers domaines : actualités, sciences, récits, instructions, courriels, brevets et projets de loi législatifs. Les expériences montrent que notre modèle atteint des performances de pointe sur l’ensemble des 12 jeux de données, mesurées par les scores ROUGE. De plus, notre modèle obtient des performances surprenantes dans des scénarios à faible ressource, dépassant les résultats précédents de l’état de l’art sur 6 jeux de données, même avec seulement 1 000 exemples. Enfin, nous avons validé nos résultats par une évaluation humaine, démontrant que les résumés générés par notre modèle atteignent un niveau comparable à celui des humains sur plusieurs jeux de données.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp