
要約
近年、生成対抗ネットワーク(GAN)は、現実的な画像の合成において大きな進展を遂げている。しかし、GANはしばしばサンプル数が少なすぎる、または異なるデータ分布に属するクラスが多すぎる画像データセット上で訓練されるため、過学習や未学習に陥りやすく、その分析は困難かつ制約される傾向にある。したがって、データセットに起因する不要な干渉を回避しつつ、GANの包括的な研究を実施するため、本研究では無限に多くのサンプルが存在し、真のデータ分布が単純かつ高次元であり、構造を持つ多様体(structured manifolds)を持つ人工データセット上でGANを訓練する。さらに、生成器の設計において最適なパラメータ集合が存在するように構成している。実験的に、さまざまな距離尺度において、GANの学習手順ではその最適パラメータを学習できていないことが明らかになった。また、モデルの複雑さが十分に高い状況下で、生成器の混合(mixture of generators)を用いた学習は、ネットワークの深さや幅を増加させるよりもより大きな性能向上をもたらすことがわかった。実験結果から、生成器の混合は、教師なし設定において自動的に異なるモードやクラスを発見できることを示している。これは、複数の生成器と識別器に生成と識別タスクが分散されることに起因すると考えられる。本研究の結論の一般化可能性の一例として、CIFAR-10データセット上で生成器の混合GANを学習した結果、従来の最先端手法と比較して、一般的な評価指標であるInception Score(IS)およびFréchet Inception Distance(FID)において顕著な性能向上が達成された。