Réseaux antagonistes génératifs triples

Nous proposons un cadre théorique des jeux unifié permettant de réaliser la classification et la génération d’images conditionnelles sous une supervision limitée. Ce cadre est formulé comme un jeu minimax à trois joueurs comprenant un générateur, un classificateur et un discriminateur, d’où son nom de Réseau Générateur Adversarial Triple (Triple-GAN). Le générateur et le classificateur modélisent respectivement les distributions conditionnelles entre images et étiquettes afin de réaliser la génération conditionnelle et la classification. Le discriminateur se concentre uniquement sur l’identification des paires image-étiquette fictives. Sous une hypothèse non paramétrique, nous démontrons que l’équilibre unique du jeu correspond à la convergence des distributions caractérisées par le générateur et le classificateur vers la distribution réelle des données. En tant que conséquence naturelle du mécanisme à trois joueurs, Triple-GAN est flexible et peut intégrer divers classificateurs semi-supervisés ainsi que différentes architectures de GAN. Nous évaluons Triple-GAN dans deux scénarios exigeants : l’apprentissage semi-supervisé et le régime extrêmement faible de données. Dans ces deux contextes, Triple-GAN parvient à obtenir de très bons résultats de classification tout en générant des échantillons significatifs pour une classe spécifique. En particulier, en utilisant un classificateur CNN à 13 couches couramment adopté, Triple-GAN surpasse de manière significative de nombreuses méthodes d’apprentissage semi-supervisé sur plus de 10 benchmarks, indépendamment de l’application ou non de l’augmentation de données.