
最近、深層ニューラルネットワークが単一画像の超解像(Single Image Super-Resolution: SISR)の性能を大幅に向上させることの有効性が示されています。多くの研究は、超解像(Super-Resolved: SR)画像の定量的な品質向上に焦点を当てています。しかし、PSNR最大化を目指すこれらの手法は、大きな拡大率でぼやけた画像を生成する傾向があります。ジェネレーティブ・アドバーサリアル・ネットワーク(Generative Adversarial Networks: GANs)の導入により、この問題は軽減され、合成された高周波テクスチャで印象的な結果が得られています。しかしながら、これらのGANベースの手法は、視覚的に高解像度なSR画像を作るために偽のテクスチャやアーティファクトを追加する傾向があります。本論文では、段階的なネットワーク構築によって視覚的に高品質な結果を逐次生成する新しい知覚的画像超解像手法を提案します。具体的には、第1フェーズでは画素レベルでの誤差最小化に重点を置き、第2フェーズでは前段階で抽出された特徴を利用し、より良い構造保持を目指します。最終段階では、第2フェーズで精製された細かい構造特徴を使用して、より現実的な結果を生成します。この方法により、知覚的画像における画素レベルと構造レベルの情報を最大限に保つことができます。また、提案手法はフィードフォワードプロセスで3種類の画像を作成することができます。さらに、マルチスケール階層特徴融合を採用した新しいジェネレーターについても検討しました。ベンチマークデータセットでの広範な実験により、当方針が既存の最先端手法よりも優れていることが確認されました。コードは https://github.com/Zheng222/PPON から入手可能です。