DreamO est un framework unifié de personnalisation d'images, lancé le 12 mai 2025 par ByteDance en collaboration avec l'École d'ingénierie électronique et informatique de l'Université de Pékin (campus de Shenzhen). Basé sur l'architecture DiT (Diffusion Transformer), ce projet intègre diverses tâches de génération d'images et prend en charge des fonctions complexes telles que l'échange de caractères (IP), l'échange de visages (ID), le transfert de style et la combinaison multi-sujets, permettant ainsi un contrôle multi-conditions via un modèle unique. Des articles de recherche associés sont disponibles. DreamO : un cadre unifié pour la personnalisation des images .
Ce tutoriel utilise des ressources pour une seule carte A6000.
2. Exemples de projets
3. Étapes de l'opération
1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web
Si « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Étant donné que le modèle est grand, veuillez patienter environ 1 à 2 minutes et actualiser la page.
2. Après être entré sur la page Web, vous pouvez démarrer une conversation avec le modèle
Description des paramètres :
tâche:
adresse IP: Supprimez automatiquement l'arrière-plan de l'image d'entrée et conservez le corps principal de l'objet/personnage. Convient aux scènes telles que les vêtements et les objets.
identifiant: Extrayez avec précision les zones de traits du visage et prenez en charge la migration des caractéristiques d'identité. Basé sur l'algorithme de reconnaissance faciale optimisé, il peut s'adapter aux portraits sous différents angles et conditions d'éclairage.
style: Vous devez ajouter la commande « générer des images du même style » avant le mot d'invite. Le système héritera de l'arrière-plan et du style visuel d'origine et réalisera l'extension créative des éléments de composition.
Largeur: Utilisé pour contrôler la largeur de l'image générée.
Hauteur: Utilisé pour contrôler la hauteur de l'image générée.
Conseils: Il est utilisé pour contrôler le degré auquel les entrées conditionnelles (telles que le texte ou les images) dans les modèles génératifs affectent les résultats générés. Des valeurs de guidage plus élevées permettront aux résultats générés de correspondre plus étroitement aux conditions d'entrée, tandis que des valeurs plus faibles conserveront plus de caractère aléatoire.
Nombre d'étapes : Représente le nombre d'itérations du modèle ou le nombre d'étapes du processus d'inférence, représentant le nombre d'étapes d'optimisation que le modèle utilise pour générer le résultat. Un nombre plus élevé d’étapes produit généralement des résultats plus précis, mais peut augmenter le temps de calcul.
Graine: Graine de nombre aléatoire, utilisée pour contrôler le caractère aléatoire du processus de génération. La même valeur Seed peut produire les mêmes résultats (à condition que les autres paramètres soient les mêmes), ce qui est très important pour reproduire les résultats.
Comment utiliser
4. Discussion
🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.
DreamO est un framework unifié de personnalisation d'images, lancé le 12 mai 2025 par ByteDance en collaboration avec l'École d'ingénierie électronique et informatique de l'Université de Pékin (campus de Shenzhen). Basé sur l'architecture DiT (Diffusion Transformer), ce projet intègre diverses tâches de génération d'images et prend en charge des fonctions complexes telles que l'échange de caractères (IP), l'échange de visages (ID), le transfert de style et la combinaison multi-sujets, permettant ainsi un contrôle multi-conditions via un modèle unique. Des articles de recherche associés sont disponibles. DreamO : un cadre unifié pour la personnalisation des images .
Ce tutoriel utilise des ressources pour une seule carte A6000.
2. Exemples de projets
3. Étapes de l'opération
1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web
Si « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Étant donné que le modèle est grand, veuillez patienter environ 1 à 2 minutes et actualiser la page.
2. Après être entré sur la page Web, vous pouvez démarrer une conversation avec le modèle
Description des paramètres :
tâche:
adresse IP: Supprimez automatiquement l'arrière-plan de l'image d'entrée et conservez le corps principal de l'objet/personnage. Convient aux scènes telles que les vêtements et les objets.
identifiant: Extrayez avec précision les zones de traits du visage et prenez en charge la migration des caractéristiques d'identité. Basé sur l'algorithme de reconnaissance faciale optimisé, il peut s'adapter aux portraits sous différents angles et conditions d'éclairage.
style: Vous devez ajouter la commande « générer des images du même style » avant le mot d'invite. Le système héritera de l'arrière-plan et du style visuel d'origine et réalisera l'extension créative des éléments de composition.
Largeur: Utilisé pour contrôler la largeur de l'image générée.
Hauteur: Utilisé pour contrôler la hauteur de l'image générée.
Conseils: Il est utilisé pour contrôler le degré auquel les entrées conditionnelles (telles que le texte ou les images) dans les modèles génératifs affectent les résultats générés. Des valeurs de guidage plus élevées permettront aux résultats générés de correspondre plus étroitement aux conditions d'entrée, tandis que des valeurs plus faibles conserveront plus de caractère aléatoire.
Nombre d'étapes : Représente le nombre d'itérations du modèle ou le nombre d'étapes du processus d'inférence, représentant le nombre d'étapes d'optimisation que le modèle utilise pour générer le résultat. Un nombre plus élevé d’étapes produit généralement des résultats plus précis, mais peut augmenter le temps de calcul.
Graine: Graine de nombre aléatoire, utilisée pour contrôler le caractère aléatoire du processus de génération. La même valeur Seed peut produire les mêmes résultats (à condition que les autres paramètres soient les mêmes), ce qui est très important pour reproduire les résultats.
Comment utiliser
4. Discussion
🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.