10日前
LoFormer:画像のぼかし除去のための局所周波数Transformer
Xintian Mao, Jiansheng Wang, Xingran Xie, Qingli Li, Yan Wang

要約
自己注意(self-attention, SA)の計算複雑性に起因して、画像のぼかし除去において一般的に用いられる手法は、局所的なSAを採用するか、粗いグローバルSAを用いることが多く、いずれもグローバルなモデリング能力の低下や細粒度な相関関係の欠如といった課題を抱えている。本研究では、細粒度の詳細情報を損なうことなく長距離依存関係を効果的にモデル化するため、新たなアプローチとして「局所周波数変換器(Local Frequency Transformer, LoFormer)」を提案する。LoFormerの各ユニット内では、周波数領域における局所チャネル別自己注意(Freq-LC)を導入し、低周波と高周波の局所窓内で同時にクロス共分散を捉える。この手法により、(1)粗い構造と細かいディテールの両方に均等な学習機会を提供し、(2)粗いグローバルSA手法と比較してより広範な表現特性を探索可能となるという利点が得られる。さらに、Freq-LCと補完的に機能するMLPゲーティング機構を導入し、不要な特徴をフィルタリングするとともにグローバルな学習能力を強化している。実験結果から、LoFormerが画像のぼかし除去タスクにおいて顕著な性能向上を達成することが示された。GoProデータセットにおいて、126G FLOPsの計算量でPSNRが34.09 dBを達成した。https://github.com/DeepMed-Lab-ECNU/Single-Image-Deblur