
摘要
生成对抗网络(GANs)在合成数据方面取得了显著的成功。然而,现有的GANs将判别器限制为二元分类器,从而限制了它们在需要生成具有丰富结构的输出任务中的学习能力,例如自然语言描述。本文提出了一种新型的生成对抗网络——RankGAN,用于生成高质量的语言描述。与训练判别器学习并为单个数据样本分配绝对二元谓词不同,所提出的RankGAN能够通过提供一个参考组来分析和排名一组由人类编写和机器编写的句子。通过集体审视一组数据样本并根据相对排名分数评估其质量,判别器能够做出更好的评估,进而有助于学习到更好的生成器。所提出的RankGAN通过策略梯度技术进行优化。在多个公开数据集上的实验结果清楚地展示了该方法的有效性。