17日前

チャンネル分割型ウィンドウ付きアテンションと周波数学習を用いた単一画像超解像

Dinh Phu Tran, Dao Duy Hung, Daeyoung Kim
チャンネル分割型ウィンドウ付きアテンションと周波数学習を用いた単一画像超解像
要約

最近、窓枠ベースのアテンション手法は、単一画像超解像(SISR)を含むコンピュータビジョンタスクにおいて大きな可能性を示している。しかし、遠方のトークン間の長距離依存関係や関係性を捉える点で限界がある可能性がある。さらに、空間領域における学習では画像の周波数情報を十分に表現できないことが明らかになった。これはSISRにおいて極めて重要な側面である。これらの課題に対処するため、本研究では特徴マップの高さおよび幅に沿って窓枠を逐次拡張することで、より効果的に長距離依存関係を捉えることができる新しいチャネル分割型アテンショントランスフォーマー(CPAT)を提案する。また、空間領域と周波数領域の両方からの情報を統合する新たな空間周波数相互作用モジュール(SFIM)を提案する。このモジュールは、特徴マップから周波数コンテンツに関する情報を豊かに提供するとともに、画像全体にわたる受容場を拡大する。実験結果から、提案するモジュールおよびアーキテクチャの有効性が確認された。特に、Urban100データセットにおける2倍拡大(x2 SR)タスクにおいて、CPATは現在の最先端手法を最大0.31dBのPSNR向上で上回った。

チャンネル分割型ウィンドウ付きアテンションと周波数学習を用いた単一画像超解像 | 最新論文 | HyperAI超神経