{ Lei Zhang Shu-Tao Xia Yongbing Zhang Jianrui Cai Tao Dai}

要約
近年、深層畳み込みニューラルネットワーク(CNN)は単一画像の超解像(SISR)分野で広く研究され、顕著な性能を達成している。しかし、既存の多数のCNNベースのSISR手法は、主にネットワークの幅広化や深さの増加に注力しており、中間層の特徴間の相関関係の探索には十分な配慮がなされていない。その結果、CNNの表現力に限界が生じている。この問題に対処するため、本論文では、より強力な特徴表現と特徴相関学習を実現するための2次元注意機構ネットワーク(SAN)を提案する。具体的には、2次特徴統計を用いてチャネルごとの特徴を適応的に再スケーリングする新たな学習可能な2次元チャネル注意モジュール(SOCA)を設計し、より識別性の高い表現を可能にする。さらに、長距離の空間的文脈情報を捉えるために非局所演算を組み込んだ非局所強化残差グループ(NLRG)構造を提案する。この構造は、さらに繰り返し適用される局所ソース残差注意グループ(LSRAG)を含み、段階的に抽象化された特徴表現を学習可能である。実験結果により、定量的評価指標および視覚的品質の両面において、本提案SANネットワークが最先端のSISR手法を上回ることを確認した。
ベンチマーク
| ベンチマーク | 方法論 | 指標 |
|---|---|---|
| image-super-resolution-on-bsd100-4x-upscaling | SAN | PSNR: 27.86 SSIM: 0.7457 |
| image-super-resolution-on-manga109-4x | SAN | PSNR: 31.66 SSIM: 0.9222 |
| image-super-resolution-on-set14-4x-upscaling | SAN | PSNR: 29.05 SSIM: 0.7921 |
| image-super-resolution-on-urban100-4x | SAN | PSNR: 27.23 SSIM: 0.8169 |