InfiniteYou-Demo Zur Hochauflösenden Bilderzeugung

Effektbeispiele

1. Einführung in das Tutorial
InfiniteYou, abgekürzt InfU, ist ein identitätserhaltendes Framework zur Bildgenerierung auf Basis von Diffusion Transformers (wie FLUX), das 2025 vom intelligenten Erstellungsteam von ByteDance eingeführt wurde. Durch fortschrittliche Technologie ist es in der Lage, die Konsistenz der Identität der Person bei der Bildgenerierung aufrechtzuerhalten und so die Mängel bestehender Methoden hinsichtlich Identitätsähnlichkeit, Text-Bild-Ausrichtung und Generierungsqualität zu beheben.
Als eines der ersten robusten Frameworks in diesem Bereich, das Diffused Transformers (DiTs) verwendet, befasst sich InfU systematisch mit drei Kernproblemen bestehender Methoden: unzureichende Identitätsähnlichkeit, Bild-Text-Ausrichtungsverzerrung sowie schlechte Generierungsqualität und ästhetische Leistung. Die Kerninnovation, InfuseNet, fügt Identitätsmerkmale über Restverbindungen in das DiT-basierte Modell ein und verbessert so die Identitätstreue erheblich, während die Generierungsfunktionen erhalten bleiben. Eine mehrstufige Trainingsstrategie, die Vortraining und überwachte Feinabstimmung (SFT) mit synthetischen Single-Person-Multi-Sample-Daten (SPMS) umfasst, wird angewendet, um die Bild-Text-Ausrichtung weiter zu optimieren, die Generierungsqualität zu verbessern und den Gesichtsduplikationseffekt wirksam zu verringern. Umfangreiche Experimente zeigen, dass InfU eine Leistung auf dem neuesten Stand der Technik erreicht und bestehende Basismethoden in allen Aspekten übertrifft. Sein Plug-and-Play-Design gewährleistet die Kompatibilität mit verschiedenen vorhandenen Methoden und liefert wichtige technische Beiträge für die akademische Gemeinschaft.
Dieses Tutorial verwendet InfiniteYou-FLUX v1.0 als Demonstration und die Rechenleistungsressource ist A6000.
Das Tutorial bietet 2 Modellversionen:
InfiniteYou-Version | Modellversion | Das für das Training verwendete Basismodell | Merkmale |
---|---|---|---|
InfiniteYou-FLUX v1.0 | aes_stage2 | FLUX.1-dev | Das Modell der zweiten Stufe nach der überwachten Feinabstimmung (SFT) weist eine bessere Bild-Text-Ausrichtung und ästhetische Leistung auf |
InfiniteYou-FLUX v1.0 | sim_stage1 | FLUX.1-dev | Das Modell der ersten Stufe vor der überwachten Feinabstimmung bietet eine höhere Ähnlichkeit der Identitätsmerkmale |
2. Bedienungsschritte
1. Klicken Sie nach dem Starten des Containers auf die API-Adresse, um die Weboberfläche aufzurufen
Wenn „Modell“ nicht angezeigt wird, bedeutet dies, dass das Modell initialisiert wird. Da das Modell groß ist, warten Sie bitte etwa 1–2 Minuten und aktualisieren Sie die Seite.

2. Sobald Sie die Website betreten, können Sie beginnen zu verwenden
❗️Wichtige Anwendungstipps:
- Modellversion: Standardverwendung
aes_stage2
Um eine bessere Bild- und Textausrichtung und ästhetische Effekte zu erzielen. Für eine höhere ID-Ähnlichkeit versuchen Siesim_stage1
. - Nützliche Hyperparameter: Normalerweise sind keine weiteren Anpassungen erforderlich. Versuchen Sie ggf. eine etwas größere
--infusenet_guidance_start
(Zum Beispiel0.1
)(Rechtssim_stage1
ist besonders effektiv). Wenn der Effekt noch immer nicht zufriedenstellend ist, versuchen Sie es mit einer etwas kleineren--infusenet_conditioning_scale
(Zum Beispiel0.9
). - Optionales LoRA:
realism
(realistisch) undanti-blur
(Anti-Unschärfe). Aktivieren Sie das entsprechende Kontrollkästchen, um es zu aktivieren. Dies sind optionale Funktionen und wurden in diesem Dokument nicht verwendet. - Gender-Tipps: Wenn das generierte Geschlecht nicht dem erwarteten entspricht, fügen Sie der Textaufforderung bitte bestimmte Wörter hinzu, z. B. „ein Mann“, „eine Frau“ usw. Dieses Projekt fördert die Verwendung einer inklusiven und respektvollen Sprache.
Anwendung


Austausch und Diskussion
🖌️ Wenn Sie ein hochwertiges Projekt sehen, hinterlassen Sie bitte im Hintergrund eine Nachricht, um es weiterzuempfehlen! Darüber hinaus haben wir auch eine Tutorien-Austauschgruppe ins Leben gerufen. Willkommen, Freunde, scannen Sie den QR-Code und kommentieren Sie [SD-Tutorial], um der Gruppe beizutreten, verschiedene technische Probleme zu besprechen und Anwendungsergebnisse auszutauschen ↓