
摘要
近年来,关于超分辨率任务固有的不适定性问题引发了广泛讨论:给定一幅低分辨率图像,可能存在多种合理的高分辨率重建结果。为应对这一挑战,SRFlow[23]采用归一化流(normalizing flows)技术,通过学习输出图像的分布而非生成单一确定性结果,实现了当前最优的感知质量。本文将SRFlow的核心思想加以改进,并应用于基于生成对抗网络(GAN)的超分辨率方法中,以有效实现“一对多”映射特性。我们对生成器结构进行重构,使其将随机噪声映射为输出图像的概率分布,从而增强生成结果的多样性与合理性。同时,针对制约感知训练目标的图像内容损失函数,我们提出改进方案,进一步提升生成图像的视觉质量。此外,我们还引入一系列新的训练策略,以进一步优化生成图像的感知表现。实验结果表明,通过将所提方法应用于ESRGAN[1],在4倍超分辨率任务中显著提升了感知性能;在16倍极端超分辨率任务中,结合RFB-ESRGAN[21]框架,取得了当前最先进的LPIPS评分,验证了方法的有效性与优越性。