
要約
深層学習を基にした単一画像の超解像手法は、大量の訓練データセットを使用し、最近では定量的にも定性的にも大きな品質向上を達成しています。多くの深層ネットワークは、低解像度入力から高解像度出力への非線形マッピングに焦点を当てていますが、特徴量の抽象化と分析には十分な探索が行われていません。本研究では、階層的バックプロジェクションネットワーク(Hierarchical Back Projection Network: HBPN)を提案します。このネットワークは、複数のアワーガラス(HourGlass: HG)モジュールをカスケード接続し、すべてのスケールで特徴量を下向き・上向きに処理することで様々な空間相関を捉え、最適な表現を統合して再構築を行います。提案するネットワークでは、バックプロジェクションブロックを採用し、単純な逆畳み込みやプーリングプロセスに代わるエラー相関のあるアップサンプリングとダウンサンプリングプロセスを提供することで、より正確な推定を実現します。また、新しいソフトマックスに基づく重み付き再構築(Weighted Reconstruction: WR)プロセスを使用して、HGモジュールの出力を組み合わせることで超解像性能のさらなる向上を目指します。各種データセット(実画像超解像チャレンジ2019年の検証データセットであるNTIRE2019など)での実験結果は、提案手法が異なる拡大率において最先端手法の性能に匹敵またはそれを上回ることを示しています。