17日前

受容 field ブロックを用いた感覚的極限スーパーサンプリングネットワーク

Taizhang Shang, Qiuju Dai, Shengchen Zhu, Tong Yang, Yandong Guo
受容 field ブロックを用いた感覚的極限スーパーサンプリングネットワーク
要約

単一画像に対する知覚的極端な超解像(Perceptual Extreme Super-Resolution)は、画像間のテクスチャ詳細に大きなばらつきがあるため、極めて困難な課題である。この困難を克服するため、Enhanced SRGANを基盤として受容野ブロック(Receptive Field Block: RFB)を導入した超解像ネットワークを提案する。本ネットワークをRFB-ESRGANと呼ぶ。主な貢献は以下の通りである。第一に、多スケール情報の抽出と特徴量の識別能の向上を目的として、物体検出および分類タスクで優れた性能を示した受容野ブロック(RFB)を超解像タスクに適用した。第二に、多スケール受容野ブロックにおいて大きな畳み込みカーネルを使用するのではなく、複数の小さなカーネルを用いることで、詳細な特徴の抽出が可能となり、同時に計算量の増加を抑制した。第三に、アップサンプリング段階において異なるアップサンプリング手法を交互に使用することで、高い計算コストを抑えるとともに、十分な性能を維持した。第四に、異なるイテレーションで学習された10個のモデルをアンサンブルすることで、モデルのロバスト性を向上させ、個々のモデルが導入するノイズを低減した。実験結果から、RFB-ESRGANが優れた性能を発揮することが明らかになった。NTIRE 2020 知覚的極端な超解像チャレンジの初期結果によれば、本手法は参加者全員の中でトップの順位を獲得した。

受容 field ブロックを用いた感覚的極限スーパーサンプリングネットワーク | 最新論文 | HyperAI超神経