Flow++ : Amélioration des modèles génératifs basés sur les flux avec la déquantification variationnelle et la conception d'architecture

Les modèles génératifs basés sur les flux sont des modèles de vraisemblance exacte puissants, dotés d'un échantillonnage et d'une inférence efficaces. Malgré leur efficacité computationnelle, ces modèles présentent généralement des performances beaucoup plus faibles en modélisation de densité par rapport aux modèles auto-régressifs de pointe. Dans cet article, nous examinons et améliorons trois choix de conception limitatifs utilisés par les modèles basés sur les flux dans les travaux précédents : l'utilisation d'un bruit uniforme pour la déquantification, l'emploi de flux affines peu expressifs et l'utilisation de réseaux de conditionnement purement convolutifs dans les couches de couplage. Sur la base de nos résultats, nous proposons Flow++, un nouveau modèle basé sur les flux qui est désormais le modèle non-auto-régressif de pointe pour l'estimation inconditionnelle de densité sur des benchmarks d'images standards. Notre travail commence à combler l'écart significatif de performance qui existait jusqu'à présent entre les modèles auto-régressifs et les modèles basés sur les flux. Notre implémentation est disponible à l'adresse suivante : https://github.com/aravindsrinivas/flowpp