LR-GAN: Schichtweise rekursive generative adversarische Netze für Bildgenerierung

Wir präsentieren LR-GAN: ein adversariales Bildgenerierungsmodell, das die Struktur und den Kontext der Szene berücksichtigt. Im Gegensatz zu früheren generativen adversarialen Netzen (GANs) lernt das vorgeschlagene GAN, Hintergrund und Vordergrund getrennt und rekursiv zu generieren, und fügt die Vordergründe auf dem Hintergrund in einem kontextuell angemessenen Verfahren zusammen, um ein vollständiges natürliches Bild zu erzeugen. Für jeden Vordergrund lernt das Modell dessen Erscheinungsbild, Form und Pose zu generieren. Das gesamte Modell ist unüberwacht und wird mit Gradientenabstiegsverfahren in einem End-to-End-Prozess trainiert. Die Experimente zeigen, dass LR-GAN natürlichere Bilder mit Objekten erzeugen kann, die für Menschen leichter erkennbar sind als bei DCGAN.