
要約
生成画像モデリングにおける最近の進歩にもかかわらず、ImageNetのような複雑なデータセットから高解像度で多様なサンプルを成功裏に生成することは依然として難題となっています。この目標達成のために、我々はこれまで試みられていない最大規模での生成対抗ネットワーク(Generative Adversarial Networks, GANs)の訓練を行い、そのような規模特有の不安定性を研究しました。結果として、ジェネレータに対して直交正規化を適用することで、入力の分散を減らすことでサンプルの忠実度と多様性のトレードオフを微調整できる単純な「切り捨てトリック」が可能になることがわかりました。これらの変更により、クラス条件付き画像合成において新しい最先端となるモデルが得られました。128x128解像度でImageNet上に訓練された我々のモデル(BigGANs)は、Inception Score (IS) が 166.5、Frechet Inception Distance (FID) が 7.4 を達成し、以前の最高記録である IS 52.52 および FID 18.6 を改善しています。