2ヶ月前

ブラインドスーパーレゾリューションの交互最適化の展開

Luo, Zhengxiong ; Huang, Yan ; Li, Shang ; Wang, Liang ; Tan, Tieniu

要約

従来の手法では、盲解像度向上（SR）問題を2つの連続的なステップに分解していました。すなわち、\textit{i}) 与えられた低解像度（LR）画像からぼかしカーネルを推定するステップと \textit{ii}) 推定されたカーネルに基づいてSR画像を復元するステップです。この2段階の解決策は、互いに独立して訓練された2つのモデルを用いるため、相互の適合性が十分でない可能性があります。第1ステップでの小さな推定誤差でも、第2ステップの性能が大幅に低下する可能性があります。一方、第1ステップではLR画像からの限られた情報しか利用できないため、高精度なぼかしカーネルの予測が困難となります。これらの課題に対処するために、我々はこれら2つのステップを別々に考えるのではなく、交互最適化アルゴリズムを採用しました。これにより、単一のモデルでぼかしカーネルを推定し、SR画像を復元することができます。具体的には、\textit{Restorer}（復元モジュール）と \textit{Estimator}（推定モジュール）という2つの畳み込みニューラルネットワークモジュールを設計しました。\textit{Restorer} は予測されたカーネルに基づいてSR画像を復元し、\textit{Estimator} は復元されたSR画像の助けを使ってぼかしカーネルを推定します。これらの2つのモジュールを反復的に交互に実行し、そのプロセスを開展することでエンドツーエンドで学習可能なネットワークを作成しました。この方法により、\textit{Estimator} はLR画像とSR画像双方からの情報を活用できるようになり、ぼかしカーネルの推定が容易になります。さらに重要な点として、\textit{Restorer} は真値のカーネルではなく \textit{Estimator} によって推定されたカーネルで訓練されるため、\textit{Estimator} の推定誤差に対する耐性が高まります。合成データセットや実世界の画像に対する広範な実験結果から、我々のモデルは最新手法よりも大幅に優れた性能を示し、より視覚的に好ましい結果を高速に生成できることを確認しています。ソースコードは https://github.com/greatlog/DAN.git で公開されています。