17日前

二重識別器を備えた生成対抗ネットワーク

{Trung Le, Dinh Phung, Tu Dinh Nguyen, Hung Vu}
二重識別器を備えた生成対抗ネットワーク
要約

本稿では、生成対抗ネットワーク(GAN)において発生するモード崩壊(mode collapse)問題に対処するための新しいアプローチを提案する。我々のアイデアは直感的でありながら、GANのいくつかの根本的な限界を克服する上で非常に有効であることが実証されている。本手法の本質は、カルバック・ライブラー(KL)距離と逆KL距離を統合した目的関数を構築することであり、これらの距離の相補的な統計的性質を活用することで、多モードのデータ分布を効果的に捉えるための推定密度の多様性を高めている。本手法を「二重判別器生成対抗ネットワーク(Dual Discriminator Generative Adversarial Nets, D2GAN)」と呼ぶ。従来のGANとは異なり、D2GANは生成器に加えて2つの判別器を備えており、これらはミニマックスゲームに類似した構造を持つ。一方の判別器はデータ分布からのサンプルに対して高いスコアを付与し、他方の判別器は生成器からのサンプルを好むように設計されている。生成器は、この2つの判別器を欺くようにデータを生成する。理論的分析により、最適な判別器が存在する条件下で、D2GANの生成器の最適化は、実データ分布と生成器によって生成されたデータから導かれる分布との間のKL距離および逆KL距離の両方を最小化することに帰着することを示した。これにより、モード崩壊問題を効果的に回避できることが明らかになった。我々は、合成データおよび実世界の大規模データセット(MNIST、CIFAR-10、STL-10、ImageNet)に対して広範な実験を実施し、最新の最先端GANモデルと比較するため、包括的な定性的および定量的評価に最大限の努力を払った。実験結果から、D2GANはベースラインモデルと比較して、高品質かつ多様なサンプルを生成するという点で競争力と優位性を示しており、ImageNet規模のデータベースへのスケーラビリティも有していることが確認された。