Autoencodeur auto-génératif dual contradictoire

Nous présentons un nouveau modèle d’autoencodeur génératif basé sur deux pertes contradictoires et distinctives, visant à améliorer les autoencodeurs génératifs capables d’effectuer simultanément une inférence (reconstruction) et une synthèse (échantillonnage). Notre modèle, nommé autoencodeur génératif à pertes contradictoires doubles (DC-VAE), intègre une perte discriminative au niveau des instances (qui préserve la fidélité au niveau de chaque instance pour la reconstruction et la synthèse) et une perte adversarielle au niveau de l’ensemble (qui encourage la fidélité au niveau de l’ensemble pour la reconstruction et la synthèse), les deux étant contradictoires et distinctives. Des résultats expérimentaux étendus obtenus par le DC-VAE sur différentes résolutions — 32×32, 64×64, 128×128 et 512×512 — sont rapportés. Les deux pertes contradictoires et distinctives du VAE fonctionnent harmonieusement dans le cadre du DC-VAE, conduisant à une amélioration qualitative et quantitative significative par rapport aux VAE de base, sans modification architecturale. Des résultats au niveau de l’état de l’art ou compétitifs sont observés parmi les autoencodeurs génératifs pour la reconstruction d’images, la synthèse d’images, l’interpolation d’images et l’apprentissage de représentations. Le DC-VAE constitue un modèle VAE polyvalent, applicable à une large variété de tâches ultérieures en vision par ordinateur et apprentissage automatique.