2ヶ月前

顔画像のスーパーレゾリューションをランドマークなしで実現する手法

Berk Dogan; Shuhang Gu; Radu Timofte
顔画像のスーパーレゾリューションをランドマークなしで実現する手法
要約

現在、視覚メディアの普及により、既に高解像度(HR)の顔画像が大量に存在しています。したがって、特定の人物の非常に低解像度(LR)の顔画像をスーパーレゾリューション化する際には、同じ人物の別のHR顔画像を見つけることが非常に高い確率で可能であり、その画像は年齢、表情、姿勢やサイズに違いがある場合でもプロセスをガイドするために使用できます。本論文では、このような別の制約のないHR顔画像をガイドとして使用し、同一人物の顔画像に対して8倍のスーパーレゾリューション(SR)を適用する畳み込みニューラルネットワーク(CNN)ベースの解決策であるGWAInetを提案します。GWAInetは敵対的生成方法で訓練され、望まれる高品質な知覚的な画像結果を生成します。HRガイド画像の利用は、入力画像とのコンテンツアライメントを行うワーパーサブネットワークと、ワーピングされたガイド画像から抽出された特徴量と入力画像からの特徴量を融合するための特徴融合チェーンを通じて実現されます。訓練においては、アイデンティティロスがSRとHR真値画像間の埋め込みベクトル距離を最小化することで同一性に関連する特徴量を保つのに役立ちます。顔スーパーレゾリューションにおける現行最先端技術とは異なり、当手法は訓練時に Facial Landmark Points を必要としないため堅牢性が向上し、周辺領域も含めた一貫した細部表現が可能となります。当手法GWAInetは8倍拡大因子で写真のようなリアルな画像を生成し、定量的な評価および知覚的品質において現行最先端技術を超える性能を示しています。