HyperAIHyperAI

Command Palette

Search for a command to run...

XVerse : Contrôle cohérent de l'identité et des attributs sémantiques de plusieurs sujets par modulation DiT

Bowen Chen Mengyi Zhao Haomiao Sun Li Chen Xu Wang Kang Du Xinglong Wu

Résumé

Pour atteindre un contrôle fin des identités de sujets et des attributs sémantiques (pose, style, éclairage) dans la génération d'images à partir de texte, en particulier pour plusieurs sujets, on constate souvent une dégradation de l'éditabilité et de la cohérence des Transformers de diffusion (DiTs). De nombreuses approches introduisent des artefacts ou souffrent d'un emmêlement des attributs. Afin de surmonter ces défis, nous proposons un nouveau modèle de génération contrôlée multi-sujet appelé XVerse. En transformant les images de référence en décalages pour la modulation spécifique aux jetons du flux textuel, XVerse permet un contrôle précis et indépendant pour chaque sujet spécifique sans perturber les latents ou les caractéristiques de l'image. Par conséquent, XVerse offre une synthèse d'images multi-sujet à haute fidélité, éditable avec un contrôle robuste sur les caractéristiques individuelles et les attributs sémantiques des sujets. Cette avancée améliore considérablement les capacités de génération de scènes personnalisées et complexes.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp