Command Palette
Search for a command to run...
効率的なスーパーレゾリューションのための迅速なパラメータフリー注意力ネットワーク
効率的なスーパーレゾリューションのための迅速なパラメータフリー注意力ネットワーク
Cheng Wan Hongyuan Yu Zhiqi Li Yihang Chen Yajun Zou Yuqing Liu Xuanwu Yin Kunlong Zuo
概要
単一画像超解像(Single Image Super-Resolution: SISR)は、低レベルコンピュータビジョンにおける重要なタスクであり、低解像度画像から高解像度画像を再構成することを目的としている。従来のアテンション機構はSISRの性能を著しく向上させてきたが、多くの場合、複雑なネットワーク構造と膨大なパラメータ数を伴い、推論速度の低下やモデルサイズの増大を引き起こすという課題があった。この問題に対処するために、本研究ではパラメータフリーの高速アテンションネットワーク(Swift Parameter-free Attention Network: SPAN)を提案する。SPANは、パラメータ数、推論速度、画像品質のバランスを高効率に実現するSISRモデルであり、新たなパラメータフリーのアテンション機構を採用している。この機構は、対称的活性化関数とリサルト接続(residual connections)を活用し、寄与度の高い情報を強化するとともに、冗長な情報を抑制する。理論的分析により、この設計がアテンション機構の目的を効果的に達成していることが示された。複数のベンチマークにおいてSPANを評価した結果、既存の効率的超解像モデルと比較して、画像品質および推論速度の両面で優れた性能を発揮し、顕著な品質-速度トレードオフを達成した。この特性により、SPANは特にリソース制約下の実世界応用に非常に適している。特に、NTIRE 2024効率的超解像チャレンジにおいて、総合性能部門および実行時間部門の両方で1位を獲得した。本研究のコードおよびモデルは、https://github.com/hongyuanyu/SPAN にて公開されている。