17 天前
软截断:一种面向高精度得分估计的基于得分的扩散模型通用训练技术
Dongjun Kim, Seungjae Shin, Kyungwoo Song, Wanmo Kang, Il-Chul Moon

摘要
近年来,扩散模型在图像生成任务中取得了最先进的性能。然而,先前关于扩散模型的实证研究暗示,密度估计能力与样本生成性能之间存在一种负相关关系。本文通过充分的实证证据表明,这种负相关现象的根源在于:密度估计主要依赖于较小的扩散时间,而样本生成则主要依赖于较大的扩散时间。然而,在整个扩散时间范围内训练一个表现良好的得分网络(score network)极具挑战性,因为不同扩散时间步上的损失尺度存在显著不平衡。为实现有效训练,本文提出一种通用性强的训练技术——软截断(Soft Truncation),该方法将原本固定且静态的截断超参数转化为一个随机变量,从而缓解损失尺度不平衡的问题。在实验中,软截断方法在CIFAR-10、CelebA、CelebA-HQ 256×256以及STL-10等多个数据集上均取得了当前最先进的性能。