
要約
近年、低解像度画像に対して複数の可能な再構成が存在するという超解像の不適切な定式化(ill-posed nature)に関する議論が広がっている。SRflow[23]は、決定論的な出力ではなく、出力の分布を学習することで、従来の手法に比べて最先端の知覚品質を達成している。本論文では、SRflowの概念を活用し、GANに基づく超解像において一対多(one-to-many)の性質を適切に実装することで性能を向上させる手法を提案する。具体的には、生成器をランダムノイズから出力分布を推定するマッピングとして再設計した。また、知覚的学習目標を妨げるコンテンツ損失を改善し、生成画像の知覚品質をさらに向上させるための追加的な訓練技術も提案している。本研究で提案する手法を用いることで、ESRGAN[1]のx4超解像における知覚品質を向上させることができた。さらに、RFB-ESRGAN[21]に本手法を適用した結果、x16の極端な超解像において、最新のLPIPSスコアを達成した。