Command Palette
Search for a command to run...
HunyuanImage-2.1 : Modèle De Diffusion Pour Les Images Hunyuan Haute Résolution (2K)
1. Introduction au tutoriel

HunyuanImage-2.1 est un modèle d'image littéraire open source lancé par l'équipe Tencent Hunyuan en septembre 2025. Il prend en charge la résolution native 2K, dispose de puissantes capacités de compréhension sémantique complexe et peut générer avec précision les détails d'une scène, les expressions et les actions des personnages. Ce modèle prend en charge la saisie en chinois et en anglais et peut générer des images de styles variés, tels que des bandes dessinées, des figurines, etc., tout en conservant un contrôle stable du texte et des détails de l'image. Il s'appuie sur des technologies telles que l'encodeur de texte double canal et la VAE haute compression, ce qui améliore considérablement l'efficacité de l'apprentissage et de l'inférence. Les résultats de l'article sont les suivants :PromptEnhancer : une approche simple pour améliorer les modèles texte-image via la réécriture des invites de chaîne de pensée".
Ce tutoriel utilise une seule carte graphique RTX PRO 6000 comme ressource de calcul, fournissant deux fonctions : la génération de texte en image et le raffinement d'image pour les tests.
2. Affichage des effets
Génération de texte en image

Affinement de l'image

3. Étapes de l'opération
1. Démarrez le conteneur
Si « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Étant donné que le modèle est grand, veuillez patienter environ 2 à 3 minutes et actualiser la page.

2. Étapes d'utilisation
1. Génération de texte en image

Description des paramètres :
- Utiliser un modèle distillé : l’utilisation d’un modèle distillé générera des résultats plus rapides mais une qualité légèrement inférieure.
- Invite : Vous pouvez saisir du texte ici.
- Invite négative : une invite négative qui indique à l'IA « de ne pas générer quelque chose ».
- Rapport hauteur/largeur : sélectionnez le rapport hauteur/largeur de l'image générée.
- Étapes d'inférence : Plus d'étapes = meilleure qualité, vitesse de génération plus lente.
- Échelle d'orientation : dans quelle mesure les instructions sont suivies.
- Graine : graine.
- Utiliser le raffineur : s'il faut utiliser le raffinement de l'image.
2. Affinement de l'image

Description des paramètres :
- Invite de raffinement : vous pouvez saisir du texte ici.
- Largeur : largeur de l'image de sortie.
- Hauteur : hauteur de l'image de sortie.
- Étapes de perfectionnement : Affiner les étapes de raisonnement. Plus d'étapes = meilleure qualité, vitesse de génération plus lente.
- Échelle d'orientation : dans quelle mesure les instructions sont suivies.
- Graine : graine.
4. Discussion
🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓

Informations sur la citation
Les informations de citation pour ce projet sont les suivantes :
@misc{HunyuanImage-2.1,
title={HunyuanImage 2.1: An Efficient Diffusion Model for High-Resolution (2K) Text-to-Image Generation},
author={Tencent Hunyuan Team},
year={2025},
howpublished={\url{https://github.com/Tencent-Hunyuan/HunyuanImage-2.1}},
}Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.