
要約
単一画像のディヘイズ処理に向けた、エンドツーエンドで学習可能な畳み込みニューラルネットワーク(CNN)であるGridDehazeNetを提案します。GridDehazeNetは、前処理モジュール、バックボーンモジュール、後処理モジュールの3つの構成要素から成ります。学習可能な前処理モジュールは、手動選択の前処理方法によって生成される入力と比較して、より多様で関連性の高い特徴を持つ学習済み入力を生成することができます。バックボーンモジュールでは、グリッドネットワーク上で新しいアテンションベースのマルチスケール推定を実装しており、従来のマルチスケールアプローチでしばしば遭遇するボトルネック問題を効果的に緩和できます。後処理モジュールは最終出力におけるアーティファクトを軽減するために役立ちます。実験結果は、GridDehazeNetが合成画像および実世界の画像においてともに現行最良の手法を上回ることを示しています。提案されたディヘイズ手法は大気散乱モデルに依存せず、さらに大気散乱モデルが提供する次元削減を利用することが必ずしも有益ではない理由について説明を提供します(合成画像でのディヘイズ結果のみを考える場合でも)。