HyperAIHyperAI

Command Palette

Search for a command to run...

Parallele Multiskalen-Autoregressive Dichteabschätzung

Scott Reed; Aäron van den Oord; Nal Kalchbrenner; Sergio Gómez Colmenarejo; Ziyu Wang; Dan Belov; Nando de Freitas

Zusammenfassung

PixelCNN erzielt Stand der Technik ergebende Resultate bei der Dichteabschätzung für natürliche Bilder. Obwohl das Training schnell ist, ist die Inferenz aufwendig und erfordert eine Netzwerkauswertung pro Pixel; O(N) für N Pixel. Dies kann durch Zwischenspeichern von Aktivierungen beschleunigt werden, beinhaltet jedoch immer noch die sequenzielle Generierung jedes Pixels. In dieser Arbeit schlagen wir ein parallelisierbares PixelCNN vor, das durch Modellierung bestimmter Pixelgruppen als bedingt unabhängig eine effizientere Inferenz ermöglicht. Unser neues PixelCNN-Modell erreicht wettbewerbsfähige Dichteabschätzungen und Beschleunigungen um mehrere Größenordnungen – O(log N) Stichprobenziehung anstelle von O(N) – was die praktische Generierung von 512x512-Bildern ermöglicht. Wir evaluieren das Modell bei klassenbedingter Bildgenerierung, Text-zu-Bild-Synthese und aktionsbedingter Videogenerierung und zeigen, dass unser Modell unter den nicht-pixel-autoregressiven Dichtemodellen, die eine effiziente Stichprobenziehung zulassen, die besten Ergebnisse erzielt.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp