DreamO est un framework de personnalisation d'image unifié lancé le 12 mai 2025 par ByteDance et l'École d'ingénierie électronique et informatique de l'École supérieure de l'Université de Pékin à Shenzhen. Le projet est basé sur l'architecture DiT (Diffusion Transformer), qui intègre une variété de tâches de génération d'images, prend en charge des fonctions complexes telles que le changement de costume (IP), le changement de visage (ID), le transfert de style (Style), la combinaison multi-sujets et réalise un contrôle multi-conditions via un seul modèle. Les résultats pertinents de l'article sontDreamO : un cadre unifié pour la personnalisation des images".
Ce tutoriel utilise des ressources pour une seule carte A6000.
2. Exemples de projets
3. Étapes de l'opération
1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web
Si « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Étant donné que le modèle est grand, veuillez patienter environ 1 à 2 minutes et actualiser la page.
2. Après être entré sur la page Web, vous pouvez démarrer une conversation avec le modèle
Description des paramètres :
tâche:
adresse IP: Supprimez automatiquement l'arrière-plan de l'image d'entrée et conservez le corps principal de l'objet/personnage. Convient aux scènes telles que les vêtements et les objets.
identifiant: Extrayez avec précision les zones de traits du visage et prenez en charge la migration des caractéristiques d'identité. Basé sur l'algorithme de reconnaissance faciale optimisé, il peut s'adapter aux portraits sous différents angles et conditions d'éclairage.
style: Vous devez ajouter la commande « générer des images du même style » avant le mot d'invite. Le système héritera de l'arrière-plan et du style visuel d'origine et réalisera l'extension créative des éléments de composition.
Largeur: Utilisé pour contrôler la largeur de l'image générée.
Hauteur: Utilisé pour contrôler la hauteur de l'image générée.
Conseils: Il est utilisé pour contrôler le degré auquel les entrées conditionnelles (telles que le texte ou les images) dans les modèles génératifs affectent les résultats générés. Des valeurs de guidage plus élevées permettront aux résultats générés de correspondre plus étroitement aux conditions d'entrée, tandis que des valeurs plus faibles conserveront plus de caractère aléatoire.
Nombre d'étapes : Représente le nombre d'itérations du modèle ou le nombre d'étapes du processus d'inférence, représentant le nombre d'étapes d'optimisation que le modèle utilise pour générer le résultat. Un nombre plus élevé d’étapes produit généralement des résultats plus précis, mais peut augmenter le temps de calcul.
Graine: Graine de nombre aléatoire, utilisée pour contrôler le caractère aléatoire du processus de génération. La même valeur Seed peut produire les mêmes résultats (à condition que les autres paramètres soient les mêmes), ce qui est très important pour reproduire les résultats.
Comment utiliser
4. Discussion
🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓