2 个月前

SwinIR: 基于Swin Transformer的图像恢复

Liang, Jingyun ; Cao, Jiezhang ; Sun, Guolei ; Zhang, Kai ; Van Gool, Luc ; Timofte, Radu
SwinIR: 基于Swin Transformer的图像恢复
摘要

图像恢复是一个长期存在的低层次视觉问题,旨在从低质量图像(例如,缩小比例、噪声和压缩图像)中恢复高质量图像。尽管当前最先进的图像恢复方法主要基于卷积神经网络,但很少有人尝试使用在高层次视觉任务中表现出色的Transformer模型。本文提出了一种基于Swin Transformer的强大的基线模型——SwinIR,用于图像恢复。SwinIR由三部分组成:浅层特征提取、深层特征提取和高质量图像重建。特别是,深层特征提取模块由多个残差Swin Transformer块(RSTB)构成,每个RSTB包含若干个Swin Transformer层以及一个残差连接。我们在三个代表性任务上进行了实验:图像超分辨率(包括经典、轻量级和真实世界图像超分辨率)、图像去噪(包括灰度和彩色图像去噪)以及JPEG压缩伪影减少。实验结果表明,SwinIR在不同任务上的性能优于现有最先进方法高达0.14~0.45 dB,同时其参数总量可以减少多达67%。