
要約
ブラインド画像のデブラーイングに向けた多くの深層学習ベースの手法は、ぼけた観測画像からぼけの表現を推定し、それを利用して対象画像を再構成する。しかし、これらの手法は現実世界のシナリオでは著しい性能低下を示す。その理由は、運動ぼけに関する重要な事前知識(例えば、現実世界の運動ぼけは多様で空間的に変化する)を無視しているためである。一部の手法ではCNNを用いて非一様なぼけカーネルを明示的に推定しようとしているが、現実世界の画像において空間的に変化するぼけカーネルの真値(ground truth)が存在しないため、正確な推定は依然として困難である。本研究では、正規化フロー(normalizing flows)を用いて運動ぼけカーネルの場を潜在空間に表現し、直接カーネルを推定するのではなく、CNNによって潜在コードを予測する手法を提案する。さらに、非一様カーネル推定の精度とロバスト性を向上させるために、潜在コード推定プロセスに不確実性学習(uncertainty learning)を導入し、画像特徴と推定されたカーネルをより効果的に統合するためのマルチスケールカーネルアテンションモジュールを提案する。多数の実験結果、特に現実世界のぼけ画像データセット上での評価において、本手法は主観的・客観的品質の両面で最先端の性能を達成するとともに、非一様画像デブラーイングにおける優れた汎化能力を示した。実装コードは以下のURLから入手可能である:https://see.xidian.edu.cn/faculty/wsdong/Projects/UFPNet.htm。