17日前
Diffusion-GAN:拡散を用いたGANの訓練
Zhendong Wang, Huangjie Zheng, Pengcheng He, Weizhu Chen, Mingyuan Zhou

要約
生成 adversarial ネットワーク(GAN)は安定した学習が困難であり、識別器の入力にインスタンスノイズを注入するという有望な手法は、実践的にはそれほど効果的ではなかった。本論文では、前向きの拡散過程(forward diffusion chain)を活用してガウス混合分布に従うインスタンスノイズを生成する新しいGANフレームワーク、Diffusion-GANを提案する。Diffusion-GANは、適応的拡散プロセス、拡散タイムステップに依存する識別器、および生成器の3つの構成要素から構成される。観測データと生成データの両方が同一の適応的拡散プロセスによって拡散される。各拡散タイムステップにおいて、ノイズとデータの比率が異なるため、タイムステップ依存型識別器は拡散された実データと拡散された生成データを区別する能力を学習する。生成器は、前向き拡散過程を逆伝播することで識別器からのフィードバックを学習し、その長さはノイズとデータのレベルをバランスさせるために適応的に調整される。理論的に、識別器のタイムステップ依存戦略が生成器に一貫性があり、有益な指導を与えることを示した。これにより、生成器は真のデータ分布に一致する能力を獲得する。様々なデータセットにおいて、強力なGANベースラインと比較してDiffusion-GANの優位性を実証した。その結果、最先端のGANよりもより現実的な画像を生成でき、安定性およびデータ効率の面で優れた性能を発揮することが明らかになった。