11日前
Wavelet-SRNet:マルチスケール顔画像超解像用のウェーブレットベースのCNN
{Tieniu Tan, Zhenan Sun, Huaibo Huang, Ran He}

要約
近年の顔画像の超解像(super-resolution)手法の多くは、畳み込みニューラルネットワーク(CNN)を用いて高解像度(HR)顔画像を推定している。しかし、極めて低解像度(LR)の画像を処理する場合、これらのCNNベースの手法の性能は著しく低下する。また、従来手法は過度に滑らかな出力結果を生成し、細部のテクスチャ情報を失いがちである。これらの課題に対処するために、本論文では、16×16ピクセル以下という極めて低解像度の顔画像を、統一されたフレームワーク内で2倍、4倍、8倍、さらには16倍という複数のスケーリング因子に対応して高解像度化することができる、ウェーブレットに基づくCNNアプローチを提案する。従来のCNN手法が直接HR画像を推定するのに対し、本手法はまず、LR画像に対応するHR画像のウェーブレット係数の系列を予測し、その後それらからHR画像を再構成する。人間の顔画像におけるグローバルなトポロジー情報とローカルなテクスチャ細部を同時に捉えるために、本研究では、3種類の損失関数(ウェーブレット予測損失、テクスチャ損失、全画像損失)を組み込んだ柔軟かつ拡張性のある畳み込みニューラルネットワークを提案する。広範な実験により、本手法が最先端の超解像手法と比較して、定量的および定性的な両面でより優れた結果を達成することが示された。