MSG-GAN: Multi-Skalige Gradienten für Generative Adversary Netzwerke

Während Generative Adversarische Netze (GANs) bei Aufgaben der Bildsynthese große Erfolge verzeichnet haben, sind sie bekannt für ihre Schwierigkeit, auf verschiedene Datensätze angepasst zu werden. Dies ist teilweise auf die Instabilität während des Trainings und die Empfindlichkeit gegenüber Hyperparametern zurückzuführen. Ein häufig angenommener Grund für diese Instabilität ist, dass die Gradienten, die vom Diskriminator zum Generator übertragen werden, uninformativ werden, wenn es nicht genügend Überlappung zwischen den Trägern der realen und gefälschten Verteilungen gibt. In dieser Arbeit schlagen wir das Multi-Skalen-Gradienten-Generative Adversarial Network (MSG-GAN) vor, eine einfache aber effektive Technik, die dieses Problem durch das Zulassen des Flusses von Gradienten vom Diskriminator zum Generator auf mehreren Skalen anspricht. Diese Technik bietet einen stabilen Ansatz für die Synthese hochaufgelöster Bilder und dient als Alternative zur häufig verwendeten progressiven Wachstumstechnik. Wir zeigen, dass MSG-GAN stabil auf einer Vielzahl von Bild-Datensätzen verschiedener Größen, Auflösungen und Domains konvergiert, sowie bei verschiedenen Arten von Verlustfunktionen und Architekturen – alles mit demselben Satz fester Hyperparameter. Im Vergleich zu den neuesten GANs entspricht unser Ansatz oder übertrifft in den meisten Fällen, die wir untersucht haben, deren Leistung.