HyperAIHyperAI

Qwen-Image : Un Modèle d'image Avec Des Capacités Avancées De Rendu De Texte

1. Introduction au tutoriel

Étoiles GitHub

Qwen-Image est un modèle de grande taille pour la génération et l'édition d'images de haute qualité, lancé par l'équipe Alibaba Tongyi Qianwen en août 2025. Ce modèle a réalisé une avancée majeure dans le domaine du rendu de texte, prend en charge la sortie haute fidélité de paragraphes multilignes en chinois et en anglais, et est capable de restituer avec précision des scènes complexes et des détails millimétriques. Qwen-Image utilise un modèle d'apprentissage collaboratif multitâche pour assurer une cohérence au pixel près lors de l'édition d'images, garantissant une absence totale de dérive du sujet, de la lumière, des ombres et de la texture tout au long du processus. Il peut générer des dizaines de styles, tels que le réalisme, l'animation, le cyberpunk, la science-fiction, le minimalisme, le rétro, le surréalisme, la peinture à l'encre, etc., en un seul clic, et prend en charge des opérations fines en pleine dimension telles que le transfert de style, l'ajout et la suppression d'éléments, l'amélioration des détails, le redessin du texte et la réinitialisation de la posture. Les résultats de l'étude sont les suivants :Rapport technique Qwen-Image".

Ce tutoriel utilise des ressources RTX A6000 à double carte.

2. Exemples de projets

3. Étapes de l'opération

1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web

2. Étapes d'utilisation

Si « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Étant donné que le modèle est grand, veuillez patienter environ 2 à 3 minutes et actualiser la page.

Description des paramètres

  • Paramètres avancés :
    • Invite négative : les mots d'invite négative sont utilisés pour spécifier le contenu ou les styles qui ne doivent pas apparaître dans l'image.
    • Graine : Graine aléatoire.
    • Randomiser la graine : s'il faut randomiser automatiquement la graine.
    • Taille de l'image (ratio) : contrôle le rapport de résolution de l'image de sortie.
    • Échelle de guidage : Échelle de guidage, utilisée pour contrôler la qualité de l'image générée.
    • Nombre d'étapes d'inférence : nombre d'étapes d'inférence utilisées pour contrôler le niveau de détail de l'image générée.

4. Discussion

🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓

Informations sur la citation

Les informations de citation pour ce projet sont les suivantes :

@article{qwen-image,
    title={Qwen-Image Technical Report}, 
    author={Qwen Team},
    journal={arXiv preprint},
    year={2025}
}
Qwen-Image : Un Modèle d'image Avec Des Capacités Avancées De Rendu De Texte | Tutoriels | HyperAI