16 天前

扩散模型在图像生成上超越生成对抗网络(GANs)

Prafulla Dhariwal, Alex Nichol
扩散模型在图像生成上超越生成对抗网络(GANs)
摘要

我们证明,扩散模型能够实现优于当前最先进生成模型的图像样本质量。在无条件图像生成任务中,我们通过一系列消融实验,发现了一种更优的网络架构,从而实现了这一目标。在条件图像生成任务中,我们进一步利用分类器引导(classifier guidance)方法提升了样本质量:这是一种简单且计算高效的策略,通过利用分类器的梯度,实现多样性与保真度之间的权衡。我们在 ImageNet 128×128 上取得了 2.97 的 FID 分数,256×256 上为 4.59,512×512 上为 7.72,即便每张样本仅需 25 次前向传播,也能达到与 BigGAN-deep 相当的性能,同时保持了对数据分布更全面的覆盖。此外,我们发现分类器引导与上采样扩散模型结合效果良好,进一步将 ImageNet 256×256 的 FID 降低至 3.94,512×512 的 FID 降低至 3.85。相关代码已开源,地址为:https://github.com/openai/guided-diffusion。

扩散模型在图像生成上超越生成对抗网络(GANs) | 最新论文 | HyperAI超神经