
摘要
近年来,机器学习社区对图像生成的兴趣显著增长,这得益于大量深度生成模型及其训练方法的不断涌现。在本工作中,我们提出了一种通用的、与模型无关的图像质量提升方法,可有效改善任意生成模型所产出图像的视觉质量与分布保真度。我们的方法名为BIGRoC(通过鲁棒分类器提升图像生成,Boosting Image Generation via a Robust Classifier),其核心思想是利用一个给定的鲁棒分类器作为指导,通过后处理过程对生成图像进行优化,且无需对原始生成模型进行额外训练。具体而言,针对一张合成图像,我们提出通过在鲁棒分类器上执行投影梯度步进(projected gradient steps)来逐步优化其特征表示,从而提升其可识别性与视觉质量。我们在多种图像生成方法上验证了该后处理算法的有效性,并在CIFAR-10和ImageNet数据集上均取得了显著的定量与定性改进。令人惊讶的是,尽管BIGRoC是首个无需依赖特定生成模型结构的图像优化方法,且仅需极少的额外信息,其性能仍优于现有多种先进方法。具体而言,在ImageNet 128×128图像生成任务中,BIGRoC使当前表现最佳的扩散模型(diffusion model)的FID分数提升了14.81%,达到2.53;在256×256分辨率下,FID分数提升了7.87%,达到3.63。此外,我们还开展了人类偏好调查,结果显示,人类观察者显著更倾向于我们的方法生成的图像。