
要約
画像の霞消去(Image dehazing)は、低レベルビジョン分野における典型的なタスクである。従来の研究では、大規模な畳み込みカーネルと注目メカニズム(attention mechanism)が霞消去において有効であることが実証されている。しかし、これらには二つの課題が存在する。第一に、大規模な畳み込みカーネルを導入することで、画像のマルチスケール特性が容易に無視されてしまうこと。第二に、標準的な注目モジュールの直列接続構造では、霞の分布が不均一な場合に十分に対応できない点である。本論文では、上記の二つの問題を解決する新たなフレームワーク、すなわち「ミックス構造画像霞消去ネットワーク(Mix Structure Image Dehazing Network, MixDehazeNet)」を提案する。本手法は主に二つの構成要素からなる:マルチスケール並列大畳み込みカーネルモジュールと、強化された並列注目モジュールである。単一の大畳み込みカーネルに比べ、マルチスケールで並列に配置された大カーネルは、霞消去プロセス中に局所的なテクスチャ情報をより適切に捉える能力を持つ。さらに、並列接続による注目モジュールを強化した構造を設計し、不均一な霞の分布に対しても優れた処理性能を発揮する。3つのベンチマークデータセットを用いた広範な実験により、本手法の有効性が実証された。例えば、従来の最先端手法と比較して、MixDehazeNetはSOTS indoorデータセットにおいて顕著な性能向上(PSNR 42.62dB)を達成した。本研究の実装コードは、GitHubにて公開されている:https://github.com/AmeryXiong/MixDehazeNet。