DuelGAN:2つのディスクリミネーター間の対決がGANの学習を安定化する

本稿では、生成対抗ネットワーク(GAN)の一種であるDuelGANを提案する。本手法は、生成サンプルの安定性を向上させるとともに、モード崩壊(mode collapse)の問題を軽減することを目的としている。従来のVanilla GANにおける識別子 $D_1$ と生成器 $G$ の二プレイヤーゲームの枠組みを基盤とし、新たに同僚的識別子 $D_2$ をミニマックスゲームに導入する。以前の二識別子構造と同様に、$D_1$ および $D_2$ の第一の役割は、生成されたサンプルと実際のサンプルを区別することであり、生成器 $G$ は両方の識別子を欺くことができる高品質なサンプルを生成することを目指す。しかし、既存手法とは異なり、$D_1$ と $D_2$ の間に新たなゲームを導入することで、両者の一致を抑制し、生成サンプルの多様性を高める。この性質により、$D_1$ と $D_2$ が早急に収束してしまうことを防ぎ、初期段階でのモード崩壊を緩和する。本研究では、$G$、$D_1$、$D_2$ の間で形成されるミニマックスゲームの均衡点について理論的解析を行い、DuelGANの収束特性およびミニマックスゲームの安定性についても示す。特に注目すべきは、DuelGANが教師なし設定(unsupervised setting)で動作可能であり、$D_1$ と $D_2$ の対立(duel)にラベル情報の監督は不要である点である。合成データセットおよび実世界の画像データセット(MNIST、Fashion MNIST、CIFAR-10、STL-10、CelebA、VGG、FFHQ)における実験結果から、DuelGANは競合するベースライン手法と比較して、多様性と品質の両面で優れた生成性能を発揮することが示された。さらに、追加計算コストはほとんど無視できる程度に抑えられている。