HyperAIHyperAI
vor 17 Tagen

Kontinuierliche bedingte generative adversarische Netzwerke: Neue empirische Verlustfunktionen und Mechanismen zur Eingabe von Labels

Xin Ding, Yongwei Wang, Zuheng Xu, William J. Welch, Z. Jane Wang
Kontinuierliche bedingte generative adversarische Netzwerke: Neue empirische Verlustfunktionen und Mechanismen zur Eingabe von Labels
Abstract

Diese Arbeit stellt das kontinuierlich bedingte generative adversarische Netzwerk (CcGAN) vor, das erste generative Modell für die Bildgenerierung unter Bedingung kontinuierlicher, skalarer Bedingungen (sogenannte Regressionslabels). Bestehende bedingte GANs (cGANs) sind hauptsächlich für kategoriale Bedingungen (z. B. Klassenlabels) konzipiert; die Bedingung an Regressionslabels ist mathematisch unterschiedlich und wirft zwei grundlegende Probleme auf: (P1) Da für bestimmte Regressionslabels möglicherweise nur sehr wenige (oder gar keine) echte Bilder existieren, versagen die üblichen empirischen cGAN-Verlustfunktionen (auch empirische cGAN-Verluste genannt) in der Praxis häufig; (P2) Da Regressionslabels skalar und unendlich viele sind, sind herkömmliche Methoden zur Eingabeverarbeitung von Labels nicht anwendbar. Das vorgeschlagene CcGAN löst diese Probleme jeweils durch (S1) die Neuausformulierung bestehender empirischer cGAN-Verluste für den kontinuierlichen Fall; und (S2) die Einführung einer einfachen Label-Eingabemethode (NLI) sowie einer verbesserten Label-Eingabemethode (ILI), um Regressionslabels effektiv in Generator und Diskriminator einzubinden. Die Neuausformulierung in (S1) führt zu zwei neuen empirischen Diskriminator-Verlustfunktionen, die als harter vicinaler Diskriminator-Verlust (HVDL) und weicher vicinaler Diskriminator-Verlust (SVDL) bezeichnet werden, sowie zu einer neuen empirischen Generator-Verlustfunktion. In dieser Arbeit werden Fehlergrenzen für einen Diskriminator, der mit HVDL und SVDL trainiert wird, unter milden Annahmen abgeleitet. Zudem werden zwei neue Benchmark-Datensätze (RC-49 und Cell-200) sowie eine neuartige Bewertungsmaßzahl (Sliding Fréchet Inception Distance) für diesen kontinuierlichen Szenario vorgeschlagen. Unsere Experimente an den Datensätzen Circular 2-D Gaussians, RC-49, UTKFace, Cell-200 und Steering Angle zeigen, dass CcGAN in der Lage ist, vielfältige, hochwertige Proben aus der Bildverteilung unter gegebenem Regressionslabel zu generieren. Darüber hinaus übertrifft CcGAN in diesen Experimenten cGAN sowohl visuell als auch quantitativ deutlich.

Kontinuierliche bedingte generative adversarische Netzwerke: Neue empirische Verlustfunktionen und Mechanismen zur Eingabe von Labels | Neueste Forschungsarbeiten | HyperAI