
単一画像の霞取り(single image dehazing)は、観測された霞まし画像から潜在的な無霞画像を推定する困難な不適切な問題(ill-posed problem)として知られている。既存の深層学習ベースの手法の多くは、畳み込み層の深さや幅を増加させることでモデル性能の向上を目指している。しかし、畳み込みニューラルネットワーク(CNN)構造の学習能力はまだ十分に探求されていない。本論文では、特徴学習を強化し、霞取り性能を向上させるために、詳細強化畳み込み(Detail-Enhanced Convolution, DEConv)とコンテンツ誘導型アテンション(Content-Guided Attention, CGA)から構成される詳細強化アテンションブロック(Detail-Enhanced Attention Block, DEAB)を提案する。具体的には、DEConvは通常の畳み込み層に事前知識(prior information)を統合することで、表現力および汎化能力を向上させる。さらに、再パラメータ化(re-parameterization)技術を用いることで、DEConvは追加のパラメータや計算コストを伴わず、単なる通常の畳み込みに等価に変換可能である。一方、CGAは各チャネルに固有の空間的重要性マップ(Spatial Importance Map, SIM)を割り当てることで、特徴量に含まれる有用な情報をより効果的に注目(attend)できる。さらに、CGAを基盤とするミックスアップ融合スキーム(mixup fusion scheme)を導入し、特徴量の有効な融合と勾配伝播の促進を実現する。上記の構成要素を統合することで、高品質な無霞画像を復元するための詳細強化アテンションネットワーク(Detail-Enhanced Attention Network, DEA-Net)を提案する。広範な実験結果により、本手法の有効性が実証された。DEA-Netは、最新の最先端(SOTA)手法を上回り、パラメータ数わずか365.3万個(3.653 M)でPSNR指標を41 dB以上向上させた。本研究のDEA-Netのソースコードは、https://github.com/cecret3350/DEA-Net にて公開される予定である。