
要約
深層学習が登場する以前の伝統的な単一画像のぼかし除去手法の多くは、粗いスケールで鮮鋭な画像を推定し、その後より細かいスケールで段階的に精緻化する「粗→細」スキームを採用していた。このスキームは、深層学習に基づくアプローチにも一部採用されてきたが、近年では、品質および計算時間の両面で従来の「粗→細」手法を上回る優れた性能を示す単一スケールアプローチが多数提案されている。本論文では、「粗→細」スキームを再検討し、従来の手法に見られる性能低下を引き起こす欠陥を分析する。その分析に基づき、これらの欠陥を改善するための新しい深層学習ベースの単一画像ぼかし除去手法である「マルチスケールステージネットワーク(MSSNet)」を提案する。具体的には、ぼかしのスケールを反映するステージ構成、スケール間の情報伝播機構、およびピクセルシャッフルを活用したマルチスケール構成という、3つの新しい技術的要素を導入している。実験の結果、MSSNetは品質、ネットワークサイズ、計算時間の観点で、現時点で最も優れた性能を達成していることが確認された。