Diagnostic Benchmark et Inpainting Itératif pour la Génération d'Images Guidée par la Mise en Page

Le contrôle spatial est une capacité essentielle dans la génération d'images contrôlable. Les progrès réalisés dans la génération d'images guidée par le layout ont montré des résultats prometteurs sur des ensembles de données in-distribution (ID) présentant des configurations spatiales similaires. Cependant, il n'est pas clair comment ces modèles se comportent face à des échantillons out-of-distribution (OOD) avec des layouts arbitraires et inconnus. Dans cet article, nous proposons LayoutBench, un benchmark diagnostique pour la génération d'images guidée par le layout qui examine quatre catégories de compétences en contrôle spatial : nombre, position, taille et forme. Nous évaluons deux méthodes récentes et représentatives de génération d'images guidée par le layout et constatons que le bon contrôle du layout ID ne se généralise pas nécessairement bien aux layouts arbitraires dans le monde réel (par exemple, les objets aux bords). Ensuite, nous proposons IterInpaint, une nouvelle ligne de base qui génère les régions avant-plan et arrière-plan étape par étape via l'inpainting, démontrant une généralisation plus forte que les modèles existants sur les layouts OOD dans LayoutBench. Nous effectuons une évaluation quantitative et qualitative ainsi qu'une analyse fine-grained des quatre compétences de LayoutBench afin d'identifier les faiblesses des modèles existants. Nous présentons également des études d'ablation exhaustives sur IterInpaint, incluant le ratio des tâches d'entraînement, la comparaison entre crop&paste et repaint, ainsi que l'ordre de génération. Enfin, nous évaluons les performances zero-shot de différents modèles pré-entraînés de génération d'images guidée par le layout sur LayoutBench-COCO, notre nouveau benchmark pour les layouts OOD avec des objets réels, où notre IterInpaint surpasse constamment les lignes de base SOTA dans tous les quatre sous-ensembles. Site web du projet : https://layoutbench.github.io