2 个月前
SwinFIR:基于快速傅里叶卷积和改进训练的图像超分辨率SwinIR重访
Dafeng Zhang; Feiyu Huang; Shizhuo Liu; Xiaobing Wang; Zhezhu Jin

摘要
基于Transformer的方法由于其在建模长距离依赖方面相比卷积神经网络(CNN)方法具有更强的能力,因此在图像恢复领域取得了令人印象深刻的性能。然而,诸如SwinIR等方法采用了基于窗口的局部注意力策略来平衡性能和计算开销,这限制了早期层中使用大感受野来捕获全局信息和建立长距离依赖。为了进一步提高捕捉全局信息的效率,在本研究中,我们提出了SwinFIR,通过替换具有全图感受野的快速傅里叶卷积(FFC)组件来扩展SwinIR。我们还重新审视了其他先进的技术,如数据增强、预训练和特征融合,以改进图像重建的效果。我们的特征融合方法能够在不增加训练和测试时间的情况下显著提升模型的性能。我们在多个流行的大型基准数据集上应用了该算法,并与现有方法相比达到了最先进的性能。例如,我们的SwinFIR在Manga109数据集上实现了32.83分贝的峰值信噪比(PSNR),比最先进的SwinIR方法高出0.8分贝。