HyperAI

FLUX.1-schnell Vincent Demo

Einführung in das Tutorial

FLUX.1 ist ein großes Modell mit 12 Milliarden Parametern, das aus Textbeschreibungen Bilder generieren kann. Wir definieren einen neuen Stand der Technik in Bezug auf Bilddetails, Zeittreue, Stilvielfalt und Szenenkomplexität für die Text-Bild-Synthese. Dieses Tutorial verwendet das Modell der Version FLUX.1 [schnell]. Das Modell und die Umgebung werden bereitgestellt. Mit dem großen Modell können Sie direkt Denkdialoge nach Anleitung des Tutorials durchführen.

Da das Modell groß ist, muss es mit A6000 ausgeführt werden und kann nicht mit einer einzelnen 4090-Karte gestartet werden.

FLUX.1 definiert den neuesten Stand der Bildsynthese. FLUX.1 [pro] und [dev] übertreffen beliebte Modelle wie Midjourney v6.0, DALL·E 3 (HD) und SD3-Ultra in jeder Hinsicht: visuelle Qualität, schnelle Nachverfolgung, Größen-/Seitenverhältnisvariabilität, Typografie und Ausgabevielseitigkeit. FLUX.1 [schnell] ist das bislang fortschrittlichste Wenige-Schritte-Modell und übertrifft nicht nur seine Konkurrenten, sondern auch starke nicht destillierte Modelle wie Midjourney v6.0 und DALL·E 3 (HD).

Um ein Gleichgewicht zwischen Zugänglichkeit und Modellfunktionalität zu erreichen, ist FLUX.1 in drei Versionen verfügbar: FLUX.1 [pro] , FLUX.1 [dev] und FLUX.1 [schnell] :

FLUX.1 [pro]: Die besten Funktionen von FLUX.1 bieten hochmoderne Bilderzeugung mit erstklassiger Sofortverfolgung, Bildqualität, Bilddetails und Ausgabevielseitigkeit. Es darf nicht für kommerzielle Zwecke verwendet werden und Sie müssen sich für die Verwendung an das Forschungsteam wenden. FLUX.1 [dev]: FLUX.1 [dev] ist ein offenes, geführtes Verfeinerungsmodell, das für nicht-kommerzielle Anwendungen geeignet ist. FLUX.1 [dev] ist direkt von FLUX.1 [pro] abgeleitet und verfügt über eine ähnliche Qualität und zeitnahe Konformität, ist dabei aber effizienter als Standardmodelle gleicher Größe. FLUX.1 [dev]-Gewichte können auf HuggingFace verwendet und direkt auf Replicate oder Fal.ai ausprobiert werden. Nicht für den kommerziellen Gebrauch. FLUX.1 [schnell]: Dieses Modell ist auf die lokale Entwicklung und den persönlichen Gebrauch zugeschnitten. FLUX.1 [schnell] ist unter der Apache 2.0-Lizenz öffentlich verfügbar.

Hauptmerkmale

  • Hochmoderne Ausgabequalität und wettbewerbsfähige Spitzenverfolgung, die der Leistung von Closed-Source-Alternativen entspricht.
  • FLUX.1 [schnell] wurde mithilfe der latenten adversarialen Diffusionsdestillation trainiert und kann in nur 1 bis 4 Schritten qualitativ hochwertige Bilder erzeugen.
  • Dieses Modell wird unter der Apache-2.0-Lizenz veröffentlicht und kann für persönliche, wissenschaftliche und kommerzielle Zwecke verwendet werden.

Vergleich mit anderen Wenshengtu-Modellwerten

Bereitstellen des Inferenzschritts

In diesem Tutorial wurden das Modell und die Umgebung bereitgestellt. Sie können das große Modell direkt für den Denkdialog gemäß den Anweisungen im Tutorial verwenden. Das spezifische Tutorial lautet wie folgt:

1. Öffnen Sie die Schnittstelle

Klicken Sie oben rechts auf der Seite auf „Klonen“, um den Container zu klonen und zu starten. Nachdem die Ressourcen konfiguriert sind, starten Sie den Container und klicken Sie direkt auf den Link an der API-Adresse, um die Demo-Oberfläche aufzurufen.


2. Geben Sie das Eingabewort ein

Nach dem Öffnen der Schnittstelle können wir die Eingabeaufforderungswörter für die Bilder eingeben, die wir generieren möchten, und die entsprechenden Bilder in hoher Qualität werden generiert. Zur Überprüfung können wir auch die Beispiele in den Beispielen verwenden.


3. Parameter ändern

Darüber hinaus gibt es im Modell mehrere Parameter, die vom Benutzer angepasst werden können. Wir können die Anzahl der Inferenzschritte des Modells unabhängig anpassen und Parameter wie Länge und Breite des Bildes generieren.

Diskussion und Austausch

🖌️ Wenn Sie ein hochwertiges Projekt sehen, hinterlassen Sie bitte im Hintergrund eine Nachricht, um es weiterzuempfehlen! Darüber hinaus haben wir auch eine Tutorien-Austauschgruppe ins Leben gerufen. Willkommen, Freunde, scannen Sie den QR-Code und kommentieren Sie [Tutorial Exchange], um der Gruppe beizutreten, verschiedene technische Probleme zu besprechen und Anwendungsergebnisse auszutauschen ↓