Kolors Kuaishou Kann Bilder Und Texte Verwenden, Um Große Modelle Zu Erstellen. Demo
Kolors Ein besseres Verständnis des chinesischen Sprachmodells

Modelleinführung
Kolors ist ein groß angelegtes Modell zur Text-zu-Bild-Generierung auf Basis latenter Diffusion, das vom Kuaishou Kolors-Team entwickelt wurde. Kolors wurde anhand von Milliarden von Text-Bild-Paaren trainiert und weist gegenüber Open-Source- und Closed-Source-Modellen erhebliche Vorteile hinsichtlich der visuellen Qualität, der komplexen semantischen Genauigkeit und der Textwiedergabe sowohl chinesischer als auch englischer Schriftzeichen auf. Darüber hinaus unterstützt Kolors sowohl chinesische als auch englische Eingaben und zeigt eine starke Leistung beim Verstehen und Generieren chinesischer Inhalte. Die generierten Ergebnisse sind mit Midjourney-v6 vergleichbar und unterstützen Texteingaben mit bis zu 256 Zeichen Länge.
Wie man läuft
1. Klonen und Ausführen des Containers
2. Wenn sich der Container im Status "Läuft" befindet, kopieren Sie die API-Adresse und öffnen Sie sie im Browser

3. Nach dem Öffnen des Links sehen Sie die folgende Oberfläche

4. Klicken Sie unten, um ein Bild hochzuladen und die Textaufforderung einzugeben. Klicken Bild generieren Das Ergebnis wird generiert
Sie können die entsprechenden Parameter auch nach Bedarf ändern
- Höhe: Ändern Sie die Höhe des generierten Bildes
- Breite: Ändern Sie die Breite des generierten Bildes
- Inferenzschritte: Die Anzahl der Rauschunterdrückungsschritte, die beim Generieren eines Bildes verwendet werden. Normalerweise werden mit der Standardanzahl an Inferenzschritten (z. B. 50) qualitativ hochwertige Bilder erzeugt. Wenn Sie eine Vorschau des generierten Effekts schnell benötigen, können Sie eine kleinere Schrittzahl verwenden. Wenn Sie ein Ergebnis von höchster Qualität wünschen, können Sie eine größere Schrittzahl verwenden.
- Anleitungsskala: Ein Hyperparameter, der steuert, inwieweit das Modell beim Generieren von Bildern Textanweisungen befolgt. Wenn der Wert größer ist (z. B. größer als 7), kann das generierte Bild optisch näher an der Beschreibung der Textaufforderung liegen und weist eine höhere Qualität und Konsistenz auf. Bei kleineren Werten (z. B. unter 7) können die generierten Bilder eine größere Vielfalt aufweisen und das Modell verlässt sich bei der Bildgenerierung weniger auf Texthinweise, was mehr Kreativität und Abwechslung ermöglicht.
- Bilder pro Eingabeaufforderung: Ändern Sie die Anzahl der vom Modell generierten Bilder.

5. Ergebnisse generieren

Diskussion und Austausch
🖌️ Wenn Sie ein hochwertiges Projekt sehen, hinterlassen Sie bitte im Hintergrund eine Nachricht, um es weiterzuempfehlen! Darüber hinaus haben wir auch eine Tutorien-Austauschgruppe ins Leben gerufen. Willkommen, Freunde, scannen Sie den QR-Code und kommentieren Sie [SD-Tutorial], um der Gruppe beizutreten, verschiedene technische Probleme zu besprechen und Anwendungsergebnisse auszutauschen ↓
