17日前

ウェーブレットに基づく拡散モデルを用いた低照度画像の増強

Hai Jiang, Ao Luo, Songchen Han, Haoqiang Fan, Shuaicheng Liu
ウェーブレットに基づく拡散モデルを用いた低照度画像の増強
要約

拡散モデル(Diffusion models)は、画像復元タスクにおいて有望な成果を上げている一方で、計算時間の長さ、過度な計算リソース消費、および復元の不安定性といった課題を抱えている。これらの問題に対処するため、本研究では、ロバストかつ効率的な低照度画像強調手法として「DiffLL」と呼ばれる拡散ベースのアプローチを提案する。具体的には、拡散モデルの生成能力を活用して視覚的に満足のいく忠実度を持つ画像を生成する、ウェーブレットに基づく条件付き拡散モデル(Wavelet-based Conditional Diffusion Model, WCDM)を構築した。さらに、ウェーブレット変換の特長を活かすことで、情報損失を伴わず推論速度を大幅に向上させ、計算リソースの消費を低減することが可能となった。混沌とした内容や過度な多様性を回避するため、WCDMの学習フェーズにおいて前向きな拡散(forward diffusion)とノイズ除去(denoising)の両方を実施し、推論時の安定性を確保するとともに、ランダム性を低減した。また、画像の縦方向および横方向の詳細情報を活用し、対角方向の情報補完を図ることで、より細粒度な復元を実現するため、高周波成分の復元モジュール(High-frequency Restoration Module, HFRM)を新たに設計した。公開されている実世界ベンチマークデータセットを用いた広範な実験により、本手法が既存の最先端手法を定量的・定性的に上回ることを示した。特に、従来の拡散モデルベース手法と比較して、処理効率において顕著な改善が得られた。さらに、実験的に低照度下での顔検出への応用も検証し、本手法が潜在的な実用的価値を有していることを示した。コードは以下のURLから公開されている:https://github.com/JianghaiSCU/Diffusion-Low-Light。

ウェーブレットに基づく拡散モデルを用いた低照度画像の増強 | 最新論文 | HyperAI超神経