HyperAIHyperAI

Command Palette

Search for a command to run...

Qwen-Image : Un Modèle d'image Avec Des Capacités Avancées De Rendu De Texte

Date

il y a 6 mois

Taille

372.42 MB

Licence

Apache 2.0

URL du document

2508.02324

1. Introduction au tutoriel

Étoiles GitHub

Qwen-Image est un modèle de génération et d'édition d'images de haute qualité, lancé en août 2025 par l'équipe Tongyi Qianwen d'Alibaba. Ce modèle réalise des avancées majeures dans le rendu de texte, permettant une reproduction fidèle de paragraphes multilignes en chinois et en anglais, et offrant une reproduction précise de scènes complexes et de détails millimétriques. Grâce à un paradigme d'apprentissage collaboratif multitâche, Qwen-Image garantit une cohérence au pixel près lors de l'édition d'images, assurant une parfaite stabilité du sujet, de l'éclairage et des textures tout au long du processus. Il permet de générer des dizaines de styles en un seul clic, parmi lesquels réaliste, anime, cyberpunk, science-fiction, minimaliste, rétro, surréaliste et peinture à l'encre, et prend en charge des opérations fines et complètes telles que le transfert de style, l'ajout et la suppression d'éléments, l'amélioration des détails, le redessinage du texte et la réinitialisation de la pose. Des articles de recherche associés sont disponibles. Rapport technique Qwen-Image .

Ce tutoriel utilise des ressources RTX A6000 à double carte.

2. Exemples de projets

3. Étapes de l'opération

1. Après avoir démarré le conteneur, cliquez sur l'adresse API pour accéder à l'interface Web

2. Étapes d'utilisation

Si « Bad Gateway » s'affiche, cela signifie que le modèle est en cours d'initialisation. Étant donné que le modèle est grand, veuillez patienter environ 2 à 3 minutes et actualiser la page.

Description des paramètres

  • Paramètres avancés :
    • Invite négative : les mots d'invite négative sont utilisés pour spécifier le contenu ou les styles qui ne doivent pas apparaître dans l'image.
    • Graine : Graine aléatoire.
    • Randomiser la graine : s'il faut randomiser automatiquement la graine.
    • Taille de l'image (ratio) : contrôle le rapport de résolution de l'image de sortie.
    • Échelle de guidage : Échelle de guidage, utilisée pour contrôler la qualité de l'image générée.
    • Nombre d'étapes d'inférence : nombre d'étapes d'inférence utilisées pour contrôler le niveau de détail de l'image générée.

4. Discussion

🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓

Informations sur la citation

Les informations de citation pour ce projet sont les suivantes :

@article{qwen-image,
    title={Qwen-Image Technical Report}, 
    author={Qwen Team},
    journal={arXiv preprint},
    year={2025}
}

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp