Classement Adversarial pour la Génération de Langage

Les réseaux de neurones adverses génératifs (GANs) ont connu de grands succès dans la synthèse de données. Cependant, les GANs existants restreignent le discriminateur à être un classifieur binaire, ce qui limite leur capacité d'apprentissage pour des tâches nécessitant la génération de sorties à structures riches, comme les descriptions en langage naturel. Dans cet article, nous proposons un nouveau réseau de neurones adverses génératif, RankGAN, pour générer des descriptions linguistiques de haute qualité. Au lieu d'entraîner le discriminateur à apprendre et à attribuer un prédicat binaire absolu pour chaque échantillon de données individuel, le RankGAN proposé est capable d'analyser et de classer une collection de phrases écrites par des humains et des machines en fournissant un groupe de référence. En considérant collectivement un ensemble d'échantillons de données et en évaluant leur qualité par des scores de classement relatifs, le discriminateur peut faire une meilleure évaluation, ce qui aide à son tour à apprendre un meilleur générateur. Le RankGAN proposé est optimisé grâce à la technique du gradient de politique. Les résultats expérimentaux sur plusieurs jeux de données publics démontrent clairement l'efficacité de l'approche proposée.