17 天前

神经扩散模型

Grigory Bartosh, Dmitry Vetrov, Christian A. Naesseth
神经扩散模型
摘要

扩散模型在众多生成任务中展现出卓越的性能。尽管近期取得了显著进展,但大多数扩散模型仍存在局限性:它们仅能对数据分布进行线性变换。相比之下,更广泛的变换族有望更高效地训练生成分布,简化反向生成过程,并缩小真实负对数似然与变分近似之间的差距。本文提出神经扩散模型(Neural Diffusion Models, NDMs),这是传统扩散模型的一种推广,能够定义并学习随时间变化的非线性数据变换。我们展示了如何在无需模拟的设定下,利用变分界对NDMs进行优化。此外,我们推导出NDMs的时间连续形式,使其能够借助现成的常微分方程(ODE)与随机微分方程(SDE)求解器实现快速且可靠的推理。最后,我们在标准图像生成基准测试(包括CIFAR-10、下采样版ImageNet以及CelebA-HQ)上通过实验验证了可学习变换在NDMs中的有效性。实验结果表明,NDMs在似然性能上优于传统扩散模型,并能生成高质量的图像样本。