
摘要
我们展示了利用扩散概率模型(diffusion probabilistic models)生成高质量图像的结果。这类模型属于潜在变量模型,其设计灵感来源于非平衡热力学的理论思考。通过基于扩散概率模型与基于Langevin动力学的去噪得分匹配之间新发现的联系,构建并训练了一个加权变分界(weighted variational bound),从而获得了最优性能。我们的模型自然地支持一种渐进式的有损解压缩机制,该机制可被理解为自回归解码过程的一种推广。在无条件的CIFAR10数据集上,我们取得了9.46的Inception分数和3.17的当前最优FID分数;在256×256分辨率的LSUN数据集上,生成样本的质量与ProgressiveGAN相当。相关代码实现已开源,地址为:https://github.com/hojonathanho/diffusion。