11 天前

投影GAN的收敛速度更快

Axel Sauer, Kashyap Chitta, Jens Müller, Andreas Geiger
投影GAN的收敛速度更快
摘要

生成对抗网络(GANs)能够生成高质量图像,但其训练过程极具挑战性,需要精细的正则化处理、大量的计算资源以及昂贵的超参数调优。为解决这些问题,我们提出将生成样本与真实样本投影至一个固定且预训练好的特征空间中。受启发于发现判别器无法充分利用预训练模型深层特征的观察,我们提出了一种更有效的策略,即在通道维度与不同分辨率之间混合特征。所提出的投影GAN(Projected GAN)显著提升了图像质量、样本效率与收敛速度。该方法可支持高达百万像素(one Megapixel)的图像分辨率,并在二十二个基准数据集上实现了当前最优的Fréchet Inception Distance(FID)性能。尤为重要的是,在相同计算资源条件下,Projected GAN达到此前最低FID值的速度提升了高达40倍,将实际运行时间从原先的5天缩短至不足3小时。

投影GAN的收敛速度更快 | 最新论文 | HyperAI超神经