11日前
StyleGANの画像品質の分析と改善
Tero Karras, Samuli Laine, Miika Aittala, Janne Hellsten, Jaakko Lehtinen, Timo Aila

要約
スタイルベースのGANアーキテクチャ(StyleGAN)は、データ駆動型の非条件的画像生成モデルにおいて、最先端の成果を達成している。本研究では、このモデルが示す特徴的なアーティファクトを明らかにし、その原因を分析した上で、モデルアーキテクチャおよび学習手法の改善を提案する。特に、生成器の正規化手法を再設計し、プログレッシブ成長(progressive growing)のアプローチを見直し、潜在コードから画像への写像における良好な条件数(well-conditioning)を促進するための正則化を導入した。これらの改善は、画像品質の向上に加え、追加的な利点ももたらす。具体的には、パス長正則化(path length regularizer)により、生成器の逆写像(inversion)が著しく容易になる。これにより、生成画像を特定のネットワークに信頼性を持って帰属させられるようになった。さらに、生成器が出力解像度をどの程度有効に活用しているかを可視化し、容量不足の問題を特定した。この問題を受けて、さらなる品質向上を目指してより大きなモデルの学習を実施した。総合的に、本研究で改善されたモデルは、既存の分布品質評価指標および人間が感じる画像品質の両面で、非条件的画像モデリングの分野における新たな最先端水準を確立した。