HyperAI

Online-Tutorial: ByteDance Macht Das Bildgenerierungsframework InfiniteYou Zu Open Source, Um Eine Hochpräzise Migration Von Gesichtsmerkmalen Zu Erreichen

vor 2 Monaten
Information
zhaorui
特色图像

InfiniteYou (kurz InfU) ist ein identitätserhaltendes Framework zur Bildgenerierung basierend auf Diffusion Transformers, das kürzlich von ByteDance Intelligent Creation eingeführt wurde.Es nutzt fortschrittliche Technologie, um die Identität der Person bei der Bilderzeugung zu wahren, d. h., es kann bei der Bilderzeugung verschiedener Szenen die Gesichtszüge präzise beibehalten..

Als eines der ersten Frameworks in diesem Bereich, das Diffused Transformers (DiTs) nutzt, befasst sich InfU systematisch mit drei Kernproblemen bestehender Methoden: unzureichende Identitätsähnlichkeit, Bild-Text-Ausrichtungsverzerrung sowie schlechte Generierungsqualität und ästhetische Leistung. Die Kerninnovation, InfuseNet, fügt über Restverbindungen Identitätsmerkmale in das DiT-Basismodell ein und verbessert so die Identitätstreue erheblich, während die Generierungsfunktionen erhalten bleiben. Eine mehrstufige Trainingsstrategie, die Vortraining und überwachte Feinabstimmung (SFT) mit synthetischen Single-Person-Multi-Sample-Daten (SPMS) umfasst, wird angewendet, um die Bild-Text-Ausrichtung weiter zu optimieren, die Generierungsqualität zu verbessern und den Gesichtsduplikationseffekt wirksam zu verringern.Umfangreiche Experimente zeigen, dass InfU eine Leistung auf SOTA-Niveau erreicht und bestehende Basismethoden in allen Aspekten übertrifft..

Derzeit wurde das Tutorial „InfiniteYou High-Fidelity Image Generation Demo“ im Tutorial-Bereich der offiziellen HyperAI-Website veröffentlicht.Bei Interesse einfach vorbeikommen und selbst ausprobieren!

Adresse des Tutorials:

https://go.hyper.ai/xQnpS

Demolauf

1. Melden Sie sich bei hyper.ai an, wählen Sie auf der Seite „Tutorials“ die Option „InfiniteYou High-Fidelity Image Generation Demo“ aus und klicken Sie auf „Dieses Tutorial online ausführen“.

2. Klicken Sie nach dem Seitensprung oben rechts auf „Klonen“, um das Tutorial in Ihren eigenen Container zu klonen.

3. Wählen Sie die Bilder „NVIDIA RTX A6000“ und „PyTorch“ aus. Die OpenBayes-Plattform bietet vier Abrechnungsmethoden. Sie können je nach Bedarf zwischen „Pay as you go“ oder „Täglich/Wöchentlich/Monatlich“ wählen. Klicken Sie auf „Weiter“.Neue Benutzer können sich über den unten stehenden Einladungslink registrieren, um 4 Stunden RTX 4090 + 5 Stunden CPU-freie Zeit zu erhalten!

Exklusiver Einladungslink von HyperAI (kopieren und im Browser öffnen):

https://openbayes.com/console/signup?r=Ada0322_NR0n

4. Warten Sie, bis die Ressourcen zugewiesen wurden. Der erste Klonvorgang dauert etwa 2 Minuten. Wenn sich der Status in „Läuft“ ändert, klicken Sie auf den Sprungpfeil neben „API-Adresse“, um zur Demoseite zu springen. Bitte beachten Sie, dass Benutzer vor der Verwendung der API-Adresszugriffsfunktion eine Echtnamenauthentifizierung durchführen müssen.

Effektanzeige

1. Nachdem Sie die Demoseite aufgerufen haben, laden Sie zunächst ein Foto mit einem Gesicht in „Identitätsbild“ hoch, geben Sie dann die Eingabeaufforderung ein und wählen Sie die Modellversion in „Modellversion“ aus. Hier wird standardmäßig „aes_stage2“ verwendet, um eine bessere Bild- und Textausrichtung und Generierungseffekte zu erzielen. Wenn Sie eine höhere ID-Ähnlichkeit benötigen, versuchen Sie es bitte mit „sim_stage1“. Unter „Kontrollbild [Optional]“ können Sie ein Kontrollbild des Gesichts hochladen. Das Modell extrahiert 5 Schlüsselpunkte des Gesichts, um die Generierung zu steuern. Dies ist kein notwendiger Gegenstand. Klicken Sie abschließend auf „Generieren“, um das Bild zu generieren.

2. Hier ist ein Foto von Yann Lecun hochgeladen, und Sie können sehen, dass der erzeugte Effekt ziemlich gut ist.

*Hinweis: Ein kultivierter Gentleman, der Selbstvertrauen ausstrahlt. Er trägt eine braunkarierte Jacke mit hohem Kragen im Stil der 1990er Jahre und einen dunkelgrauen Rollkragenpullover. Seine Hose ist maßgeschneidert und anthrazitfarben und wird durch einen eleganten Ledergürtel ergänzt. Im Hintergrund ist eine elegante Bibliothek mit Bücherregalen, einem Marmorkamin und warmer Beleuchtung zu sehen, die eine edle und gemütliche Atmosphäre schafft. Seine entspannte Haltung und die lässige Hand-in-der-Tasche-Haltung tragen zu seinem gelassenen und stilvollen Auftreten bei

Das Obige ist das diesmal von HyperAI empfohlene Tutorial. Kommen Sie vorbei und probieren Sie es selbst aus!

Adresse des Tutorials:https://go.hyper.ai/xQnpS