8日前

画像の霞取りのためのアンサンブル多スケール残差注目ネットワーク(EMRA-net)

{Jixiao Wang; Chaofeng Li; Shoukun Xu}
要約

画像のハaze除去は、曇りのある画像からクリアな画像を復元することを目的とする、長年にわたり挑戦的な課題である。本論文では、直接クリアな画像を生成することを目的として、エンセムブル・マルチスケール・リジッド・アテンションネットワーク(EMRA-Net)を提案する。本ネットワークは、三スケールのリジッドアテンションCNN(TRA-CNN)と、エンセムブルアテンションCNN(EA-CNN)の二つの構成要素からなる。TRA-CNNでは、従来の空間的ダウンサンプリング手法(例:最近傍補間やストライド畳み込み)に代えて、ウェーブレット変換を用いてダウンサンプリングされた画像を取得する。これにより、画像のテクスチャ細部情報の損失を回避できる。さらに、各スケールブランチにおいて、Res2Netモジュールを直列に接続することで、元の曇り画像から得られる階層的特徴を効果的に活用し、チャネルアテンション機構を導入してチャネル次元の情報を重点的に扱う。最後に、TRA-CNNから生成された粗い画像を統合するため、EA-CNNを提案し、高精細なクリアな画像を生成する。ベンチマークとして用いられる合成曇りデータセットおよび実世界の曇り画像データセットにおける広範な実験結果から、本提案手法であるEMRA-Netが、従来の最先端手法と比較して、主観的な視覚的評価および客観的な画像品質評価指標の両面で優れていることが確認された。

画像の霞取りのためのアンサンブル多スケール残差注目ネットワーク(EMRA-net) | 最新論文 | HyperAI超神経