
要約
既存の画像の霞消去(defogging)または霧除去(dehazing)手法の多くは、煙、粉塵、霧などに見られる密集かつ非均一な粒子分布を考慮していない。このような密集および/または非均一な分布に対処することは困難であり、霧による減衰および大気光(または覆い効果、veiling effect)が入力画像内の背景シーン情報を著しく弱体化させるためである。この問題に対処するため、不確実性フィードバック学習を組み込んだ構造表現ネットワークを提案する。具体的には、事前に学習されたビジョン変換器(DINO-ViT)モジュールから特徴表現を抽出することで、背景情報を回復する。さらに、非均一な霧領域に注目させるために、不確実性フィードバック学習を導入し、濃い霧領域で高い不確実性を持つ不確実性マップを生成する。このマップは、霧の密度および分布の非均一性を表す一種の注目マップ(attention map)として機能する。この不確実性マップを基に、フィードバックネットワークが反復的にデフォグされた出力を精緻化する。また、大気光色の推定が困難な問題に対処するため、入力画像のグレースケール版を活用する。これは、入力画像中に存在しうる変動する光源色の影響を受けにくいためである。実験結果により、本手法が、密集かつ非均一な霧や煙の除去において、最先端の手法と比較して定量的・定性的に優れた効果を示したことが確認された。