
摘要
本文提出了一种新颖的方法,用以解决生成对抗网络(GAN)中常见的模式崩溃(mode collapse)问题。我们的方法直观且已被证明非常有效,尤其在克服GAN的一些关键局限性方面表现突出。其核心思想是将Kullback-Leibler(KL)散度与反向KL散度统一整合到一个目标函数中,从而充分利用这两种散度在统计特性上的互补优势,有效提升对多模态数据分布的建模能力,增强生成样本的多样性。我们将该方法命名为双判别器生成对抗网络(Dual Discriminator Generative Adversarial Nets, D2GAN)。与传统GAN不同,D2GAN包含两个判别器,配合一个生成器共同构成一个类极小极大博弈(minimax game)的框架:其中一个判别器对来自真实数据分布的样本给予高分,而另一个判别器则相反,倾向于为生成器所产样本打高分;与此同时,生成器的目标是生成能够同时欺骗这两个判别器的数据。我们建立了理论分析,证明在判别器达到最优的情况下,优化D2GAN中的生成器等价于最小化真实数据分布与生成器所产生数据分布之间的KL散度和反向KL散度,从而从根本上缓解甚至避免模式崩溃问题。我们在合成数据以及多个真实世界的大规模数据集(包括MNIST、CIFAR-10、STL-10和ImageNet)上进行了大量实验,尽最大努力在定性和定量两个层面,将D2GAN与当前最先进的GAN变体进行系统比较。实验结果表明,我们的方法在生成高质量、高多样性的样本方面显著优于各类基线模型,并展现出良好的可扩展性,能够有效应用于ImageNet级别的大规模图像生成任务。