HyperAIHyperAI
il y a 17 jours

Réseaux antagonistes génératifs conditionnels continus : pertes empiriques novatrices et mécanismes d’entrée d’étiquettes

Xin Ding, Yongwei Wang, Zuheng Xu, William J. Welch, Z. Jane Wang
Réseaux antagonistes génératifs conditionnels continus : pertes empiriques novatrices et mécanismes d’entrée d’étiquettes
Résumé

Ce travail propose le réseau adversaire génératif conditionnel continu (CcGAN), le premier modèle génératif pour la génération d’images conditionnelles à des conditions continues et scalaires (dites étiquettes de régression). Les GAN conditionnels existants (cGAN) sont principalement conçus pour des conditions catégorielles (par exemple, étiquettes de classe) ; la condition sur des étiquettes de régression est mathématiquement distincte et soulève deux problèmes fondamentaux : (P1) Comme il peut y avoir très peu (voire zéro) image réelle associée à certaines étiquettes de régression, la minimisation des versions empiriques existantes des pertes cGAN (appelées pertes cGAN empiriques) échoue fréquemment en pratique ; (P2) Étant donné que les étiquettes de régression sont scalaires et infinies, les méthodes classiques d’entrée d’étiquettes ne sont pas applicables. Le CcGAN proposé résout ces problèmes respectivement par : (S1) une reformulation des pertes cGAN empiriques existantes afin de les rendre adaptées au cadre continu ; et (S2) la proposition d’une méthode d’entrée d’étiquettes naïve (NLI) et d’une méthode améliorée d’entrée d’étiquettes (ILI) permettant d’intégrer les étiquettes de régression dans le générateur et le discriminateur. La reformulation décrite en (S1) conduit à deux nouvelles pertes empiriques pour le discriminateur, nommées respectivement perte de discriminateur vicinale dure (HVDL) et perte de discriminateur vicinale douce (SVDL), ainsi qu’à une nouvelle perte empirique pour le générateur. Les bornes d’erreur d’un discriminateur entraîné avec HVDL et SVDL sont établies dans ce travail sous des hypothèses modérées. Deux nouveaux jeux de données de référence (RC-49 et Cell-200) ainsi qu’un nouvel indicateur d’évaluation (Distance de Fréchet à glissement) sont également proposés pour ce cadre continu. Nos expériences sur les distributions gaussiennes 2D circulaires, les jeux de données RC-49, UTKFace, Cell-200 et Steering Angle montrent que le CcGAN est capable de générer des échantillons diversifiés et de haute qualité à partir de la distribution d’images conditionnellement à une étiquette de régression donnée. En outre, dans ces expériences, le CcGAN surpasses significativement le cGAN à la fois visuellement et quantitativement.

Réseaux antagonistes génératifs conditionnels continus : pertes empiriques novatrices et mécanismes d’entrée d’étiquettes | Articles de recherche récents | HyperAI