DuelGAN : Un duel entre deux discriminateurs stabilise l'entraînement des GAN

Dans cet article, nous introduisons DuelGAN, une solution basée sur les réseaux génératifs adversariels (GAN) visant à améliorer la stabilité des échantillons générés et à atténuer le phénomène de collapse de modes. S’appuyant sur le jeu à deux joueurs du GAN classique entre le discriminateur $D_1$ et le générateur $G$, nous introduisons un second discriminateur pair $D_2$ dans le jeu min-max. À l’instar des travaux antérieurs utilisant deux discriminateurs, le rôle initial de $D_1$ et $D_2$ est de distinguer les échantillons générés des échantillons réels, tandis que le générateur tente de produire des échantillons de haute qualité capables de tromper les deux discriminateurs. À la différence des méthodes existantes, nous introduisons un nouveau jeu entre $D_1$ et $D_2$ afin de décourager leur accord mutuel, ce qui augmente ainsi le niveau de diversité des échantillons générés. Cette propriété atténue le problème du collapse de modes précoce en empêchant $D_1$ et $D_2$ de converger trop rapidement. Nous fournissons une analyse théorique de l’équilibre du jeu min-max impliquant $G$, $D_1$ et $D_2$, ainsi qu’une étude de la convergence de DuelGAN et de la stabilité du jeu min-max. Il est à noter que DuelGAN fonctionne dans un cadre non supervisé, et que le duel entre $D_1$ et $D_2$ ne nécessite aucune supervision par étiquettes. Les résultats expérimentaux sur un jeu de données synthétiques ainsi que sur des jeux de données réels d’images (MNIST, Fashion MNIST, CIFAR-10, STL-10, CelebA, VGG et FFHQ) démontrent que DuelGAN surpasser les méthodes de référence en termes de diversité et de qualité des échantillons générés, tout en ajoutant un coût computationnel négligeable.