Verbesserte Techniken für das Training von GANs

Wir präsentieren eine Vielzahl neuer architektonischer Merkmale und Trainingsverfahren, die wir im Rahmen der Generativen Widersprüchlichen Netze (Generative Adversarial Networks, GANs) anwenden. Wir konzentrieren uns auf zwei Anwendungen von GANs: das semi-supervisierte Lernen und die Erzeugung von Bildern, die für Menschen visuell realistisch sind. Im Gegensatz zu den meisten Arbeiten über generative Modelle ist unser primäres Ziel nicht, ein Modell zu trainieren, das Testdaten eine hohe Wahrscheinlichkeit zuordnet, noch verlangen wir, dass das Modell ohne Verwendung von Labels gut lernen kann. Mit unseren neuen Techniken erzielen wir Stand-of-the-Art-Ergebnisse in semi-supervisierter Klassifizierung auf MNIST, CIFAR-10 und SVHN. Die generierten Bilder sind von hoher Qualität, wie durch einen visuellen Turing-Test bestätigt: unser Modell erzeugt MNIST-Stichproben, die Menschen nicht von echten Daten unterscheiden können, sowie CIFAR-10-Stichproben, die einen menschlichen Fehlerquote von 21,3 % ergeben. Wir präsentieren auch ImageNet-Stichproben mit bislang unerreichter Auflösung und zeigen, dass unsere Methoden das Modell befähigen, erkennbare Merkmale der ImageNet-Klassen zu lernen.