HyperAI

PhotoMaker V2 Erstellt Personalisierte Fotos in Sekundenschnelle Demo

PhotoMaker V2: Verbesserte ID-Treue und mehr Kontrolle gegenüber V1

Einführung in das Tutorial

PhotoMaker ist ein effizientes, individuell anpassbares Grafikmodell für Porträts, das 2024 vom Tencent-Team als Open Source bereitgestellt wurde. Es kann schnell individuelle Fotos im künstlerischen Stil auf der Grundlage von Porträtfotos erstellen. Neben der Erstellung personalisierter Porträts können auch Alter und Geschlecht der Charaktere geändert und die Eigenschaften verschiedener Charaktere integriert werden, um neue Charakterinformationen zu erstellen. Es ist ein sehr praktisches KI-Malwerkzeug. Bei diesem Tutorial handelt es sich um die Version 2.0 von PhotoMaker, bei der die Konsistenz und Steuerbarkeit der Zeichen im Vergleich zu V1 erheblich verbessert wurde.

Dieses Tutorial hat die entsprechende Umgebung bereits eingerichtet. Sie müssen nur einen Befehl eingeben, um die Demo zu erleben.

Wesentliche Verbesserungen in PhotoMaker V2

  • Die ID-Treue wurde weiter verbessert, insbesondere bei der Eingabe einzelner Bilder und asiatischer Gesichter. Durch die Einspeisung weiterer Gesichtsbilder können noch bessere Ergebnisse erzielt werden.
  • Durch die Integration von ControlNet, Twi-Adapter und IP-Adapter wird der Generierungsprozess besser steuerbar. Das Forschungsteam stellte das entsprechende Skript zur Verfügung. Darüber hinaus ermöglicht PhotoMaker V2 Benutzern durch die Kombination mit IP-Adapter-FaceID, InstantID und Character LoRA eine bessere ID-Konsistenz.
  • PhotoMaker V2 übernimmt die guten Funktionen von PhotoMaker V1, wie z. B. hohe Qualität und vielfältige Generierungsfunktionen sowie leistungsstarke Textsteuerung. Darüber hinaus können frühere Modelle integriert werden, beispielsweise durch die Wiederherstellung der Realität von Personen auf alten Fotos oder Gemälden, durch Identitätsvermischung und durch die Änderung von Alter oder Geschlecht.

Effektanzeige

Wie man läuft

1. Öffnen Sie nach dem Klonen und Starten des Containers den Arbeitsbereich

1

2. Erstellen Sie ein neues Terminal und geben Sie den Befehl ein bash run.sh

3. Nachdem Port 8080 angezeigt wird, klicken Sie auf den Link unter der API-Adresse rechts, um das Modellerlebnis zu starten

4. Nach dem Aufrufen der Website sehen Sie die folgende Oberfläche

  • Laden Sie das Porträtbild hoch, das Sie verwenden möchten (Sie können mehrere Bilder hochladen).
  • Mithilfe englischer Eingabeaufforderungen generiert das Modell Bilder basierend auf den Eingabeaufforderungen.

Beachten Sie, dass das zu generierende Kategorievokabular das Triggerwort img verwenden muss, z. B. „Mann img“, „Frau img“, „Mädchen img“.

  • Wählen Sie den gewünschten Stil aus der Stilvorlage aus. Bei diesen Stilen handelt es sich um einige voreingestellte Eingabeaufforderungen.
  • Klicken Sie auf „Senden“, um das Bild zu generieren.

Unten auf der Website finden Sie einige Beispiele. Klicken Sie darauf, um sie direkt zu laden.

Sie können die erweiterten Einstellungen auch entsprechend Ihren Anforderungen ändern. Nachfolgend finden Sie einige Parameterbeschreibungen.

  • Negative Eingabeaufforderung: Dies gibt Funktionen an, die beim Generieren der Ausgabe vermieden werden sollten. Durch die Eingabe von Begriffen wie „schlechte Symmetrie, schlechte Qualität, geringe Qualität, Illustration, 3D, 2D, Gemälde, Cartoon, Skizze, offener Mund“ versucht das Modell, die Einbeziehung dieser Merkmale in die generierten Bilder zu vermeiden.
  • Anzahl der Beispielschritte: Dies steuert die Anzahl der Schritte, die das Modell beim Generieren von Bildern ausführt. Mehr Schritte führen im Allgemeinen zu Bildern höherer Qualität, da das Modell mehr Möglichkeiten hat, die Ausgabe zu verfeinern.
  • Stilstärke: Hiermit wird angegeben, wie stark der angegebene Stil das Ausgabebild beeinflussen soll. Je höher der Prozentsatz, desto einflussreicher der Stil.
  • Anzahl der Ausgabebilder: Hiermit wird festgelegt, wie viele Bilder das Modell in einem Generierungsprozess generieren soll
  • Führungsskala: Dieser Parameter legt fest, wie streng das Modell den Anweisungen folgen soll. Ein höheres Führungsverhältnis bedeutet, dass das Modell der Eingabeaufforderung genauer folgt, was zu genaueren, aber weniger kreativen Ergebnissen führen kann.
  • Seed: Der Seed-Wert wird verwendet, um den Zufallszahlengenerator zu initialisieren und die Ausgabe zu beeinflussen. Durch die Festlegung eines bestimmten Seeds können Sie reproduzierbare Ergebnisse sicherstellen. Wenn Sie „Randomize Seed“ aktivieren, wird jedes Mal ein anderes Bild generiert.

Diskussion und Austausch

🖌️ Wenn Sie ein hochwertiges Projekt sehen, hinterlassen Sie bitte im Hintergrund eine Nachricht, um es weiterzuempfehlen! Darüber hinaus haben wir auch eine Tutorien-Austauschgruppe ins Leben gerufen. Willkommen, Freunde, scannen Sie den QR-Code und kommentieren Sie [Tutorial Exchange], um der Gruppe beizutreten, verschiedene technische Probleme zu besprechen und Anwendungsergebnisse auszutauschen ↓