DreamO est un framework unifié de personnalisation d'images, lancé le 12 mai 2025 par ByteDance en collaboration avec l'École d'ingénierie électronique et informatique de l'Université de Pékin (campus de Shenzhen). Basé sur l'architecture DiT (Diffusion Transformer), ce projet intègre diverses tâches de génération d'images et prend en charge des fonctions complexes telles que l'échange de caractères (IP), l'échange de visages (ID), le transfert de style et la combinaison multi-sujets, permettant ainsi un contrôle multi-conditions via un modèle unique. Des articles de recherche associés sont disponibles. DreamO : un cadre unifié pour la personnalisation des images .
Ce tutoriel utilise des ressources pour une seule carte A6000.
2. Exemples de projets
3. Étapes de l'opération
1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web
Si « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Étant donné que le modèle est grand, veuillez patienter environ 1 à 2 minutes et actualiser la page.
2. Après être entré sur la page Web, vous pouvez démarrer une conversation avec le modèle
Description des paramètres :
tâche:
adresse IP: Supprimez automatiquement l'arrière-plan de l'image d'entrée et conservez le corps principal de l'objet/personnage. Convient aux scènes telles que les vêtements et les objets.
identifiant: Extrayez avec précision les zones de traits du visage et prenez en charge la migration des caractéristiques d'identité. Basé sur l'algorithme de reconnaissance faciale optimisé, il peut s'adapter aux portraits sous différents angles et conditions d'éclairage.
style: Vous devez ajouter la commande « générer des images du même style » avant le mot d'invite. Le système héritera de l'arrière-plan et du style visuel d'origine et réalisera l'extension créative des éléments de composition.
Largeur: Utilisé pour contrôler la largeur de l'image générée.
Hauteur: Utilisé pour contrôler la hauteur de l'image générée.
Conseils: Il est utilisé pour contrôler le degré auquel les entrées conditionnelles (telles que le texte ou les images) dans les modèles génératifs affectent les résultats générés. Des valeurs de guidage plus élevées permettront aux résultats générés de correspondre plus étroitement aux conditions d'entrée, tandis que des valeurs plus faibles conserveront plus de caractère aléatoire.
Nombre d'étapes : Représente le nombre d'itérations du modèle ou le nombre d'étapes du processus d'inférence, représentant le nombre d'étapes d'optimisation que le modèle utilise pour générer le résultat. Un nombre plus élevé d’étapes produit généralement des résultats plus précis, mais peut augmenter le temps de calcul.
Graine: Graine de nombre aléatoire, utilisée pour contrôler le caractère aléatoire du processus de génération. La même valeur Seed peut produire les mêmes résultats (à condition que les autres paramètres soient les mêmes), ce qui est très important pour reproduire les résultats.
Comment utiliser
4. Discussion
🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓
Ce notebook est fourni par des utilisateurs de la communauté et est destiné à des fins éducatives et informatives uniquement. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour un examen et un retrait rapides.
Créer de l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.
DreamO est un framework unifié de personnalisation d'images, lancé le 12 mai 2025 par ByteDance en collaboration avec l'École d'ingénierie électronique et informatique de l'Université de Pékin (campus de Shenzhen). Basé sur l'architecture DiT (Diffusion Transformer), ce projet intègre diverses tâches de génération d'images et prend en charge des fonctions complexes telles que l'échange de caractères (IP), l'échange de visages (ID), le transfert de style et la combinaison multi-sujets, permettant ainsi un contrôle multi-conditions via un modèle unique. Des articles de recherche associés sont disponibles. DreamO : un cadre unifié pour la personnalisation des images .
Ce tutoriel utilise des ressources pour une seule carte A6000.
2. Exemples de projets
3. Étapes de l'opération
1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web
Si « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Étant donné que le modèle est grand, veuillez patienter environ 1 à 2 minutes et actualiser la page.
2. Après être entré sur la page Web, vous pouvez démarrer une conversation avec le modèle
Description des paramètres :
tâche:
adresse IP: Supprimez automatiquement l'arrière-plan de l'image d'entrée et conservez le corps principal de l'objet/personnage. Convient aux scènes telles que les vêtements et les objets.
identifiant: Extrayez avec précision les zones de traits du visage et prenez en charge la migration des caractéristiques d'identité. Basé sur l'algorithme de reconnaissance faciale optimisé, il peut s'adapter aux portraits sous différents angles et conditions d'éclairage.
style: Vous devez ajouter la commande « générer des images du même style » avant le mot d'invite. Le système héritera de l'arrière-plan et du style visuel d'origine et réalisera l'extension créative des éléments de composition.
Largeur: Utilisé pour contrôler la largeur de l'image générée.
Hauteur: Utilisé pour contrôler la hauteur de l'image générée.
Conseils: Il est utilisé pour contrôler le degré auquel les entrées conditionnelles (telles que le texte ou les images) dans les modèles génératifs affectent les résultats générés. Des valeurs de guidage plus élevées permettront aux résultats générés de correspondre plus étroitement aux conditions d'entrée, tandis que des valeurs plus faibles conserveront plus de caractère aléatoire.
Nombre d'étapes : Représente le nombre d'itérations du modèle ou le nombre d'étapes du processus d'inférence, représentant le nombre d'étapes d'optimisation que le modèle utilise pour générer le résultat. Un nombre plus élevé d’étapes produit généralement des résultats plus précis, mais peut augmenter le temps de calcul.
Graine: Graine de nombre aléatoire, utilisée pour contrôler le caractère aléatoire du processus de génération. La même valeur Seed peut produire les mêmes résultats (à condition que les autres paramètres soient les mêmes), ce qui est très important pour reproduire les résultats.
Comment utiliser
4. Discussion
🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓
Ce notebook est fourni par des utilisateurs de la communauté et est destiné à des fins éducatives et informatives uniquement. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour un examen et un retrait rapides.
Créer de l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.