MaCow: Maskierte Faltungsgenerative Fluss

Flussbasierte Generative Modelle, die aufgrund der Handhabbarkeit sowohl der exakten Log-Likelihood-Berechnung als auch der Inferenz latenter Variablen und der Effizienz sowohl des Trainings als auch des Samplings konzeptionell attraktiv sind, haben zu einer Reihe beeindruckender empirischer Erfolge geführt und viele fortgeschrittene Varianten sowie theoretische Untersuchungen hervorgebracht. Trotz ihrer Rechenleistungseffizienz fällt die Dichteabschätzung von flussbasierten Generativen Modellen erheblich hinter jene der modernsten autoregressiven Modelle zurück. In dieser Arbeit stellen wir masked convolutional generative flow (MaCow) vor, eine einfache aber effektive Architektur für generativen Fluss unter Verwendung maskierter Faltungen. Durch die Einschränkung der lokalen Verbindungsstruktur in einem kleinen Kern profitiert MaCow von schnellem und stabilen Training sowie effizientem Sampling, während es gleichzeitig erhebliche Verbesserungen im Vergleich zu Glow bei der Dichteabschätzung auf Standardbildbenchmarks erreicht und den Abstand zu autoregressiven Modellen erheblich verringert.