2ヶ月前
SwinIR: Swin Transformer を使用した画像復元
Liang, Jingyun ; Cao, Jiezhang ; Sun, Guolei ; Zhang, Kai ; Van Gool, Luc ; Timofte, Radu

要約
画像修復は、低品質の画像(例えば、縮小された、ノイズが含まれている、または圧縮された画像)から高品質の画像を再生することを目指す長年の低レベル視覚問題です。最先端の画像修復手法は畳み込みニューラルネットワークに基づいていますが、高レベル視覚タスクで印象的な性能を示しているトランスフォーマーを用いた試みはまだ少ないです。本論文では、Swin Transformer を基にした強力なベースラインモデルである SwinIR を提案します。SwinIR は浅層特徴抽出、深層特徴抽出、および高品質画像再構築の3つの部分から構成されています。特に、深層特徴抽出モジュールは複数の残差スウィントランスフォーマーブロック (RSTB) で構成されており、それぞれが複数のスウィントランスフォーマーレイヤーと残差接続を持っています。私たちは3つの代表的なタスクについて実験を行いました:画像超解像(古典的、軽量、および実世界の画像超解像)、画像ノイズ除去(グレースケールおよびカラー画像ノイズ除去)、JPEG 圧縮アーティファクト削減。実験結果は、SwinIR が異なるタスクにおいて最先端手法を最大 0.14〜0.45dB 上回りながら、パラメータ総数を最大 67% 減少させることができることを示しています。