7 天前

一种用于训练变分自编码器先验的对比学习方法

Jyoti Aneja, Alexander Schwing, Jan Kautz, Arash Vahdat
一种用于训练变分自编码器先验的对比学习方法
摘要

变分自编码器(Variational Autoencoders, VAEs)是一类强大的基于似然的生成模型,在多个领域具有广泛应用。然而,当从先验分布中直接采样且未进行任何调制(tempering)时,VAEs 在生成高质量图像方面仍存在显著困难。VAEs 生成质量不佳的一个重要原因在于“先验空洞问题”(prior hole problem):先验分布与聚合近似后验分布之间存在不匹配。由于这种不匹配,潜在空间中存在一些先验密度较高的区域,却无法对应任何实际编码图像。从这些区域采样得到的样本在解码后会产生失真或损坏的图像。为解决该问题,本文提出一种基于能量的先验分布,其形式为一个基础先验分布与一个重加权因子(reweighting factor)的乘积。该重加权因子旨在使基础先验更贴近聚合近似后验分布。我们通过噪声对比估计(Noise Contrastive Estimation, NCE)训练该重加权因子,并进一步将其推广至包含多个潜在变量组的分层VAE结构中。实验结果表明,在MNIST、CIFAR-10、CelebA 64以及CelebA HQ 256等多个数据集上,所提出的噪声对比先验显著提升了当前先进VAE模型的生成性能。该方法实现简单,可广泛适用于各类VAE架构,有效增强了模型先验分布的表达能力。

一种用于训练变分自编码器先验的对比学习方法 | 最新论文 | HyperAI超神经