
要約
画像復元は、劣化した画像から鮮鋭な画像を再構成することを目的とする技術であり、多くの分野において重要な役割を果たしている。近年、Transformerモデルは、さまざまな画像復元タスクにおいて有望な性能を示している。しかし、その二次時間計算量の問題は、実用応用において依然として解決困難な課題である。本研究の目的は、効率的かつ効果的な画像復元フレームワークの構築である。劣化画像内の異なる領域は、不同程度の劣化を受けるという事実に着想を得て、復元に際して重要な領域に注目することを提案する。これを実現するために、エッジ信号や困難な領域など、復元に重要な情報を強調するための二重ドメイン選択機構を導入した。さらに、高解像度特徴量を分割することで、ネットワーク内に多スケールの受容場を組み込み、効率性と性能の両方を向上させた。最終的に、これらの設計をU字型のバックボーンに統合して、FocalNetと名付けた新しいネットワークを構築した。広範な実験により、単一画像の焦点ぼけ除去、画像霞み除去、画像雪除去の3つのタスクにおいて、10のデータセットで最先端の性能を達成することが確認された。本研究のコードは、https://github.com/c-yn/FocalNet にて公開されている。