1. Einführung in das Tutorial

HunyuanImage-2.1 ist ein Open-Source-Text-zu-Bild-Modell, das im September 2025 vom Hunyuan-Team von Tencent veröffentlicht wurde. Es unterstützt native 2K-Auflösung, verfügt über leistungsstarke Funktionen zur komplexen semantischen Analyse und kann Szenendetails, Gesichtsausdrücke und Aktionen präzise generieren. Das Modell unterstützt chinesische und englische Eingaben und kann Bilder in verschiedenen Stilen wie Comics und Figuren erzeugen, wobei die Kontrolle über Text und Details innerhalb der Bilder erhalten bleibt. Das Modell basiert auf einem Zweikanal-Text-Encoder und hochkomprimierenden VAE-Technologien, was die Effizienz von Training und Inferenz deutlich verbessert. Zugehörige Forschungsarbeiten sind verfügbar. PromptEnhancer: Ein einfacher Ansatz zur Verbesserung von Text-zu-Bild-Modellen durch Umschreiben von Gedankenketten-Prompts .

Dieses Tutorial verwendet eine einzelne RTX PRO 6000-Grafikkarte als Rechenressource und bietet zwei Funktionen: Text-zu-Bild-Generierung und Bildverfeinerung zum Testen.

2. Effektanzeige

Text-zu-Bild-Generierung

Bildverfeinerung

3. Bedienungsschritte

1. Starten Sie den Container

Wenn „Bad Gateway“ angezeigt wird, bedeutet dies, dass das Modell initialisiert wird. Da das Modell groß ist, warten Sie bitte etwa 2–3 Minuten und aktualisieren Sie die Seite.

2. Anwendungsschritte

1. Text-zu-Bild-Generierung

Parameterbeschreibung:

Destilliertes Modell verwenden: Die Verwendung eines destillierten Modells führt zu schnelleren Ergebnissen, allerdings mit etwas geringerer Qualität.
Eingabeaufforderung: Hier können Sie Text eingeben.
Negative Eingabeaufforderung: Eine negative Eingabeaufforderung, die der KI sagt, „nichts zu generieren“.
Seitenverhältnis: Wählen Sie das Seitenverhältnis des generierten Bildes.
Inferenzschritte: Inferenzschritte. Mehr Schritte = bessere Qualität, langsamere Generierungsgeschwindigkeit.
Anleitungsskala: Wie streng Anweisungen befolgt werden.
Samen: Samen.
Verfeinerung verwenden: Ob eine Bildverfeinerung verwendet werden soll.

2. Bildverfeinerung

Parameterbeschreibung:

Verfeinerungsaufforderung: Hier können Sie Text eingeben.
Breite: Breite des Ausgabebildes.
Höhe: Höhe des Ausgabebildes.
Verfeinerungsschritte: Verfeinern Sie die Argumentationsschritte. Mehr Schritte = bessere Qualität, langsamere Generierungsgeschwindigkeit.
Anleitungsskala: Wie streng Anweisungen befolgt werden.
Samen: Samen.

Zitationsinformationen

Die Zitationsinformationen für dieses Projekt lauten wie folgt:

@misc{HunyuanImage-2.1,
  title={HunyuanImage 2.1: An Efficient Diffusion Model for High-Resolution (2K) Text-to-Image Generation},
  author={Tencent Hunyuan Team},
  year={2025},
  howpublished={\url{https://github.com/Tencent-Hunyuan/HunyuanImage-2.1}},
}

Dieses Notebook wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Bei urheberrechtlichen Bedenken kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Notebook-Übersicht

Stufe

Einsteiger

Thema

Computer Vision Generative KI

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Dieses Notebook ausführen Auf Discord diskutieren

Datum

vor 8 Monaten

1. Einführung in das Tutorial

Dieses Tutorial verwendet eine einzelne RTX PRO 6000-Grafikkarte als Rechenressource und bietet zwei Funktionen: Text-zu-Bild-Generierung und Bildverfeinerung zum Testen.