HyperAIHyperAI

Command Palette

Search for a command to run...

Génération suivante de granularité visuelle

Yikai Wang Zhouxia Wang Zhonghua Wu Qingyi Tao Kang Liao Chen Change Loy

Résumé

Nous proposons une nouvelle approche de génération d’images en décomposant une image en une séquence structurée, où chaque élément de la séquence présente la même résolution spatiale mais diffère par le nombre de jetons uniques utilisés, permettant ainsi de capturer différents niveaux de granularité visuelle. La génération d’images s’effectue via notre nouveau cadre de génération, appelé Next Visual Granularity (NVG), qui génère une séquence de granularité visuelle à partir d’une image vide, en la raffinant progressivement, de manière structurée, du plan global aux détails fins. Ce processus itératif encode une représentation hiérarchique et multicouche, offrant un contrôle fin sur le processus de génération à travers plusieurs niveaux de granularité. Nous entraînons une série de modèles NVG pour la génération d’images conditionnelles par classe sur le jeu de données ImageNet, et observons un comportement clair d’échelle. En comparaison avec la série VAR, NVG obtient systématiquement de meilleurs scores FID (3,30 → 3,03, 2,57 → 2,44, 2,09 → 2,06). Nous menons également une analyse approfondie pour démontrer les capacités et le potentiel du cadre NVG. Notre code et nos modèles seront publiés.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp