
要約
近年の単一画像超解像技術の進展は、主にトークンミキサーおよびトランスフォーマー構造に支えられてきた。WaveMixSRは、空間的なトークンミキシングに2次元離散ウェーブレット変換(2D-DWT)を採用したWaveMixアーキテクチャを用いて、優れた性能と顕著なリソース効率を実現した。本研究では、(1) 伝統的な転置畳み込み層をピクセルシャッフル操作に置き換え、(2) 高解像度タスク(4倍拡大)に対応するマルチステージ設計を導入することで、WaveMixSRアーキテクチャの強化版を提案する。実験の結果、我々が提案する強化モデル「WaveMixSR-V2」は、複数の超解像タスクにおいて他のアーキテクチャを上回り、BSD100データセットにおいて最先端の性能を達成した。同時に、より少ないリソース消費、高いパラメータ効率、低遅延および高いスループットを実現した。本研究のコードは、https://github.com/pranavphoenix/WaveMixSR にて公開されている。