HyperAIHyperAI

Command Palette

Search for a command to run...

Diagnostic Benchmark et Inpainting Itératif pour la Génération d'Images Guidée par la Mise en Page

Jaemin Cho¹ Linjie Li² Zhengyuan Yang² Zhe Gan² Lijuan Wang² Mohit Bansal¹

Résumé

Le contrôle spatial est une capacité essentielle dans la génération d'images contrôlable. Les progrès réalisés dans la génération d'images guidée par le layout ont montré des résultats prometteurs sur des ensembles de données in-distribution (ID) présentant des configurations spatiales similaires. Cependant, il n'est pas clair comment ces modèles se comportent face à des échantillons out-of-distribution (OOD) avec des layouts arbitraires et inconnus. Dans cet article, nous proposons LayoutBench, un benchmark diagnostique pour la génération d'images guidée par le layout qui examine quatre catégories de compétences en contrôle spatial : nombre, position, taille et forme. Nous évaluons deux méthodes récentes et représentatives de génération d'images guidée par le layout et constatons que le bon contrôle du layout ID ne se généralise pas nécessairement bien aux layouts arbitraires dans le monde réel (par exemple, les objets aux bords). Ensuite, nous proposons IterInpaint, une nouvelle ligne de base qui génère les régions avant-plan et arrière-plan étape par étape via l'inpainting, démontrant une généralisation plus forte que les modèles existants sur les layouts OOD dans LayoutBench. Nous effectuons une évaluation quantitative et qualitative ainsi qu'une analyse fine-grained des quatre compétences de LayoutBench afin d'identifier les faiblesses des modèles existants. Nous présentons également des études d'ablation exhaustives sur IterInpaint, incluant le ratio des tâches d'entraînement, la comparaison entre crop&paste et repaint, ainsi que l'ordre de génération. Enfin, nous évaluons les performances zero-shot de différents modèles pré-entraînés de génération d'images guidée par le layout sur LayoutBench-COCO, notre nouveau benchmark pour les layouts OOD avec des objets réels, où notre IterInpaint surpasse constamment les lignes de base SOTA dans tous les quatre sous-ensembles. Site web du projet : https://layoutbench.github.io


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Diagnostic Benchmark et Inpainting Itératif pour la Génération d'Images Guidée par la Mise en Page | Articles | HyperAI