
要約
GANの学習における不安定性は、顕著な研究努力にもかかわらず長年にわたり持続する課題であった。本研究では、固定されたターゲット分布と段階的に生成される分布の間にある脆弱なバランスが、ミニバッチ統計に基づく特徴マッチングを困難にしていることにより、不安定性の原因が生じていることを明らかにした。本研究では、識別器に特徴量量子化(Feature Quantization, FQ)を導入することで、本物データと偽物データの両方を共有の離散空間に埋め込む手法を提案する。FQによって得られる量子化値は、最近の分布履歴の特徴統計と整合性を持つ動的な辞書として構築されるため、コンパクトな空間内で堅牢な特徴マッチングを間接的に実現できる。本手法は既存のGANモデルに容易に組み込むことができ、学習時の計算負荷はほとんど増加しない。FQは、画像生成に用いるBigGAN、顔合成に用いるStyleGAN、非教師付き画像間変換に用いるU-GAT-ITという3つの代表的なGANモデルに対して、9つのベンチマークで評価された。広範な実験結果から、提案手法であるFQ-GANは、さまざまなタスクにおいてベースライン手法のFIDスコアを大幅に改善し、新たなSOTA(最先端)性能を達成した。