
摘要
尽管在盲超分辨率领域已有诸多尝试,旨在恢复具有未知且复杂退化特征的低分辨率图像,但现有方法在处理真实世界中普遍存在的退化图像方面仍存在显著不足。本文将强大的ESRGAN模型拓展为一种实用的图像恢复应用(即Real-ESRGAN),该模型仅使用纯合成数据进行训练。具体而言,我们引入了一种高阶退化建模过程,以更准确地模拟真实世界中复杂的退化现象。同时,我们在合成过程中充分考虑了常见的振铃效应和过冲伪影问题。此外,我们采用带有谱归一化(spectral normalization)的U-Net判别器,以增强判别器的表达能力并稳定训练过程的动力学特性。大量实验对比表明,Real-ESRGAN在多个真实图像数据集上均展现出优于先前方法的视觉重建效果。此外,我们还提供了高效的实现方案,支持在训练过程中实时生成训练样本对。