
要約
単一の曇り画像のデハaze処理、特に小さな学習データセットを用いた場合の課題は非常に難しい。本研究では、この問題に対処するための新規な生成的対抗ネットワーク(GAN)アーキテクチャとして、バックプロジェクション・ピラミッドネットワーク(BPPNet)を提案する。本手法は、濃い曇りや不均一な曇りなど、多様で困難な曇り状況において優れた性能を発揮する。本アーキテクチャは、UNetの反復ブロックを通じて空間的コンテキストを保持しつつ、複数の複雑度レベルの学習を統合するとともに、新規のピラミッド畳み込みブロックにより、複数スケールの構造情報を捉える。これらのブロックは生成器として統合され、バックプロジェクションを介した学習が可能となる。実験の結果、わずか20組の曇り画像と非曇り画像のペアを用いても、過剰適合(over-fitting)を回避しながらネットワークを学習可能であることを示した。また、NTIRE 2018の均一な曇りデータセット(屋内・屋外画像)、NTIRE 2019の濃い曇りデータセット、およびNTIRE 2020の非均一な曇りデータセットにおいて、現時点での最先端性能を達成した。