Présentation du modèle

Kolors est un modèle de génération de texte en image à grande échelle basé sur la diffusion latente développé par l'équipe Kuaishou Kolors. Formé sur des milliards de paires texte-image, Kolors démontre des avantages significatifs par rapport aux modèles open source et fermés en termes de qualité visuelle, de précision sémantique complexe et de rendu de texte pour les caractères chinois et anglais. De plus, Kolors prend en charge la saisie en chinois et en anglais et démontre de solides performances en matière de compréhension et de génération de contenu chinois. Les résultats générés sont comparables à Midjourney-v6 et prennent en charge la saisie de texte jusqu'à 256 caractères.

Comment courir

1. Cloner et exécuter le conteneur

2. Lorsque le conteneur est dans l'état « En cours d'exécution », copiez l'adresse de l'API et ouvrez-la dans le navigateur

3. Après avoir ouvert le lien, vous pouvez voir l'interface suivante

4. Cliquez ci-dessous pour télécharger une image et saisir le texte. Cliquez Générer une image Le résultat est généré

Vous pouvez également modifier les paramètres pertinents selon vos besoins

Hauteur : Modifier la hauteur de l'image générée
Largeur : Modifie la largeur de l'image générée
Étapes d'inférence : nombre d'étapes de débruitage utilisées lors de la génération d'une image. En général, l’utilisation du nombre par défaut d’étapes d’inférence (par exemple 50) produit des images de haute qualité. Si vous avez besoin de prévisualiser rapidement l’effet généré, vous pouvez utiliser un numéro d’étape plus petit ; si vous souhaitez un résultat de la plus haute qualité, vous pouvez utiliser un numéro d'étape plus grand.
Échelle de guidage : un hyperparamètre qui contrôle le degré auquel le modèle obéit aux invites textuelles lors de la génération d'images. Lorsque la valeur est plus grande (par exemple, supérieure à 7), l'image générée peut être visuellement plus proche de la description de l'invite de texte, avec une qualité et une cohérence supérieures. À des valeurs plus petites (par exemple inférieures à 7), les images générées peuvent montrer plus de diversité et le modèle s'appuiera moins sur des indices textuels lors de la génération d'images, permettant plus de créativité et de variation.
Images par invite : modifiez le nombre d'images générées par le modèle.

5. Générer des résultats

Discussion et échange

🖌️ Si vous voyez un projet de haute qualité, veuillez laisser un message en arrière-plan pour le recommander ! De plus, nous avons également créé un groupe d’échange de tutoriels. Bienvenue aux amis pour scanner le code QR et commenter [Tutoriel SD] pour rejoindre le groupe pour discuter de divers problèmes techniques et partager les résultats de l'application↓

Ce notebook est fourni par des utilisateurs de la communauté et est destiné à des fins éducatives et informatives uniquement. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour un examen et un retrait rapides.

Nemotron-Speech-Streaming-ASR : Démonstration De Reconnaissance Vocale Automatique

il y a 20 jours

Démo De Génération 3D TRELLIS.2

il y a 18 jours

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Exécuter ce Notebook Discuter sur Discord

Date

il y a 2 ans

Taille

297.05 MB

Balises

Génération D'images

Texte Vers Image

GitHub

Kwai-Kolors/Kolors

Présentation du modèle