HyperAIHyperAI
vor 2 Monaten

InfoGAN: Interpretierbares Repräsentationslernen durch Informationsmaximierung in generativen adversären Netzen

Xi Chen; Yan Duan; Rein Houthooft; John Schulman; Ilya Sutskever; Pieter Abbeel
InfoGAN: Interpretierbares Repräsentationslernen durch Informationsmaximierung in generativen adversären Netzen
Abstract

Dieses Papier beschreibt InfoGAN, eine informations-theoretische Erweiterung des Generativen Adversarischen Netzes (Generative Adversarial Network), die in der Lage ist, entkoppelte Darstellungen (disentangled representations) vollständig unüberwacht zu lernen. InfoGAN ist ein generatives adversariales Netzwerk, das auch die gegenseitige Information (mutual information) zwischen einer kleinen Teilmenge der latenten Variablen und der Beobachtung maximiert. Wir leiten eine untere Schranke für das Ziel der gegenseitigen Information ab, die effizient optimiert werden kann, und zeigen, dass unser Trainingsverfahren als Variation des Wake-Sleep-Algorithmus interpretiert werden kann. Insbesondere gelingt es InfoGAN, Schreibstile von Ziffernformen im MNIST-Datensatz, Pose von Beleuchtung in 3D-rendered Bildern und Hintergrundziffern vom zentralen Ziffern im SVHN-Datensatz erfolgreich zu entkoppeln. Es entdeckt außerdem visuelle Konzepte wie Frisuren, Anwesenheit oder Abwesenheit von Brillen und Emotionen im CelebA-Gesichtsdatensatz. Experimente zeigen, dass InfoGAN interpretierbare Darstellungen lernt, die mit den durch bestehende vollständig überwachte Methoden gelernten Darstellungen konkurrieren können.

InfoGAN: Interpretierbares Repräsentationslernen durch Informationsmaximierung in generativen adversären Netzen | Neueste Forschungsarbeiten | HyperAI