HyperAIHyperAI
il y a 17 jours

SAN : Induire la métrisabilité des GAN via une couche linéaire normalisée discriminante

Yuhta Takida, Masaaki Imaizumi, Takashi Shibuya, Chieh-Hsin Lai, Toshimitsu Uesaka, Naoki Murata, Yuki Mitsufuji
SAN : Induire la métrisabilité des GAN via une couche linéaire normalisée discriminante
Résumé

Les réseaux antagonistes génératifs (GANs) apprennent une distribution de probabilité cible en optimisant un générateur et un discriminateur selon des objectifs minimax. Ce papier aborde la question de savoir si cette optimisation fournit effectivement au générateur des gradients permettant de rapprocher sa distribution de la distribution cible. Nous dérivons des conditions métrisables, des conditions suffisantes pour que le discriminateur agisse comme une distance entre les distributions, en établissant un lien entre la formulation GAN et le concept de transport optimal tranché (sliced optimal transport). Par ailleurs, en exploitant ces résultats théoriques, nous proposons un nouveau schéma d'entraînement pour les GANs, appelé réseau adversarial tranché (slicing adversarial network, SAN). Grâce à de simples modifications, une large classe de GANs existants peut être convertie en SANs. Des expériences menées sur des jeux de données synthétiques et d'images soutiennent nos résultats théoriques ainsi que l'efficacité du SAN par rapport aux GANs classiques. En outre, nous appliquons le SAN à StyleGAN-XL, ce qui permet d'obtenir un score FID d'état de l'art parmi les GANs pour la génération conditionnelle par classe sur ImageNet à une résolution de 256×256. Notre implémentation est disponible à l'adresse suivante : https://ytakida.github.io/san.