HyperAIHyperAI

Command Palette

Search for a command to run...

Flow++ : Amélioration des modèles génératifs basés sur les flux avec la déquantification variationnelle et la conception d'architecture

Jonathan Ho Xi Chen Aravind Srinivas Yan Duan Pieter Abbeel

Résumé

Les modèles génératifs basés sur les flux sont des modèles de vraisemblance exacte puissants, dotés d'un échantillonnage et d'une inférence efficaces. Malgré leur efficacité computationnelle, ces modèles présentent généralement des performances beaucoup plus faibles en modélisation de densité par rapport aux modèles auto-régressifs de pointe. Dans cet article, nous examinons et améliorons trois choix de conception limitatifs utilisés par les modèles basés sur les flux dans les travaux précédents : l'utilisation d'un bruit uniforme pour la déquantification, l'emploi de flux affines peu expressifs et l'utilisation de réseaux de conditionnement purement convolutifs dans les couches de couplage. Sur la base de nos résultats, nous proposons Flow++, un nouveau modèle basé sur les flux qui est désormais le modèle non-auto-régressif de pointe pour l'estimation inconditionnelle de densité sur des benchmarks d'images standards. Notre travail commence à combler l'écart significatif de performance qui existait jusqu'à présent entre les modèles auto-régressifs et les modèles basés sur les flux. Notre implémentation est disponible à l'adresse suivante : https://github.com/aravindsrinivas/flowpp


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Flow++ : Amélioration des modèles génératifs basés sur les flux avec la déquantification variationnelle et la conception d'architecture | Articles | HyperAI