HyperAI

Kolors Kuaishou Peut Utiliser Des Images Et Des Textes Pour Créer De Grands Modèles Démo

Kolors Un grand modèle de Wenshengtu qui comprend mieux le chinois

Présentation du modèle

Kolors est un modèle de génération de texte en image à grande échelle basé sur la diffusion latente développé par l'équipe Kuaishou Kolors. Formé sur des milliards de paires texte-image, Kolors démontre des avantages significatifs par rapport aux modèles open source et fermés en termes de qualité visuelle, de précision sémantique complexe et de rendu de texte pour les caractères chinois et anglais. De plus, Kolors prend en charge la saisie en chinois et en anglais et démontre de solides performances en matière de compréhension et de génération de contenu chinois. Les résultats générés sont comparables à Midjourney-v6 et prennent en charge la saisie de texte jusqu'à 256 caractères.

Comment courir

1. Cloner et exécuter le conteneur

2. Lorsque le conteneur est dans l'état « En cours d'exécution », copiez l'adresse de l'API et ouvrez-la dans le navigateur

3. Après avoir ouvert le lien, vous pouvez voir l'interface suivante

4. Cliquez ci-dessous pour télécharger une image et saisir le texte. Cliquez Générer une image Le résultat est généré

Vous pouvez également modifier les paramètres pertinents selon vos besoins

  • Hauteur : Modifier la hauteur de l'image générée
  • Largeur : Modifie la largeur de l'image générée
  • Étapes d'inférence : nombre d'étapes de débruitage utilisées lors de la génération d'une image. En général, l’utilisation du nombre par défaut d’étapes d’inférence (par exemple 50) produit des images de haute qualité. Si vous avez besoin de prévisualiser rapidement l’effet généré, vous pouvez utiliser un numéro d’étape plus petit ; si vous souhaitez un résultat de la plus haute qualité, vous pouvez utiliser un numéro d'étape plus grand.
  • Échelle de guidage : un hyperparamètre qui contrôle le degré auquel le modèle obéit aux invites textuelles lors de la génération d'images. Lorsque la valeur est plus grande (par exemple, supérieure à 7), l'image générée peut être visuellement plus proche de la description de l'invite de texte, avec une qualité et une cohérence supérieures. À des valeurs plus petites (par exemple inférieures à 7), les images générées peuvent montrer plus de diversité et le modèle s'appuiera moins sur des indices textuels lors de la génération d'images, permettant plus de créativité et de variation.
  • Images par invite : modifiez le nombre d'images générées par le modèle.

5. Générer des résultats

Discussion et échange

🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓