13 天前

预设生成对抗网络

Adji B. Dieng, Francisco J. R. Ruiz, David M. Blei, Michalis K. Titsias
预设生成对抗网络
摘要

生成对抗网络(Generative Adversarial Networks, GANs)是一种强大的无监督学习方法,在图像领域已取得当前最优的性能表现。然而,GANs在两个方面存在局限性:其一,它们往往学习到支持集较小的分布——这一现象被称为“模式坍缩”(mode collapse);其二,GANs无法保证概率密度的存在,导致无法通过预测对数似然(predictive log-likelihood)来评估模型的泛化能力。本文提出了一种名为“指定生成对抗网络”(Prescribed GAN, PresGAN)的新方法,以解决上述问题。PresGAN通过在密度网络(density network)的输出中添加噪声,并优化一种熵正则化的对抗损失函数,从而实现改进。引入的噪声使得预测对数似然的近似计算变得可行,同时显著提升了训练过程的稳定性。熵正则化项则促使PresGAN能够捕捉数据分布中的所有模式,有效缓解模式坍缩问题。在模型拟合过程中,需计算熵正则化项的不可解析梯度,PresGAN通过采用无偏的随机估计方法,巧妙规避了这一计算难题。我们在多个数据集上对PresGAN进行了评估,结果表明,该方法能够有效缓解模式坍缩问题,并生成具有高感知质量的样本。此外,我们还发现,PresGAN显著缩小了传统GAN与变分自编码器(Variational Autoencoders, VAEs)在预测对数似然性能上的差距,进一步提升了GAN在密度估计任务中的表现。