HyperAI

Online-Tutorial: Verarbeiten Sie Ein Bild in 9 Sekunden! Das Effiziente Bildbearbeitungsframework In-Context Edit Wird Eingeführt

特色图像

Bei bestehenden Bildbearbeitungsmethoden besteht vor allem das Problem, dass Genauigkeit und Effizienz nicht immer die richtige Balance finden. Feinabstimmungsmethoden erfordern viele Rechenressourcen und qualitativ hochwertige Datensätze, während Techniken ohne Training Schwierigkeiten haben, die Qualität des Verständnisses und der Bearbeitung von Anweisungen zu erreichen. In diesem ZusammenhangEin Forschungsteam der Zhejiang University und der Harvard University hat In-Context Edit (ICEdit) auf den Markt gebracht, ein befehlsbasiertes Framework zur Bildbearbeitung.Mit nur wenigen Textbefehlen lassen sich präzise Bildänderungen vornehmen, was mehr Möglichkeiten zur Bildbearbeitung und Inhaltserstellung bietet.

In-Context Edit behebt die Einschränkungen bestehender Techniken durch drei wichtige Beiträge: ein kontextbezogenes Bearbeitungsframework, eine LoRA-MoE-Hybrid-Tuning-Strategie und eine Methode zur Zeitskalierung der frühen Filterinferenz. Im Vergleich zu früheren Methoden werden nur 1% trainierbare Parameter (200 M) und 0,1% Trainingsdaten (50.000) verwendet, es weist jedoch eine bessere Generalisierungsfähigkeit auf und ist in der Lage, eine Vielzahl von Bildbearbeitungsaufgaben zu bewältigen. Gleichzeitig, verglichen mit Gemini und GPT-4o,Dieses Open-Source-Tool ist nicht nur günstiger und schneller (die Verarbeitung eines Bildes dauert nur etwa 9 Sekunden), sondern verfügt auch über eine sehr leistungsstarke Leistung.

derzeit,„In-Context Edit: Befehlsgesteuerte Bildgenerierung und -bearbeitung“ wurde im Abschnitt „Tutorials“ der offiziellen Website von HyperAI veröffentlicht.Klicken Sie auf den Link unten, um das Tutorial zur Bereitstellung mit einem Klick zu erleben ⬇️

Link zum Tutorial:https://go.hyper.ai/SHowG

Demolauf

1. Nachdem Sie die Homepage von hyper.ai aufgerufen haben, wählen Sie die Seite „Tutorial“, wählen Sie „In-Context Edit: Befehlsgesteuerte Bildgenerierung und -bearbeitung“ und klicken Sie auf „Dieses Tutorial online ausführen“.

2. Klicken Sie nach dem Seitensprung oben rechts auf „Klonen“, um das Tutorial in Ihren eigenen Container zu klonen.

3. Wählen Sie die Bilder „NVIDIA GeForce RTX 4090“ und „PyTorch“ aus. Die OpenBayes-Plattform bietet vier Abrechnungsmethoden. Sie können je nach Bedarf zwischen „Pay as you go“ oder „Täglich/Wöchentlich/Monatlich“ wählen. Klicken Sie auf „Weiter“. Neue Benutzer können sich über den unten stehenden Einladungslink registrieren, um 4 Stunden RTX 4090 + 5 Stunden CPU-freie Zeit zu erhalten!

Exklusiver Einladungslink von HyperAI (kopieren und im Browser öffnen):

https://openbayes.com/console/signup?r=Ada0322_NR0n

4. Warten Sie, bis die Ressourcen zugewiesen wurden. Der erste Klonvorgang dauert etwa 2 Minuten. Wenn sich der Status in „Läuft“ ändert, klicken Sie auf den Sprungpfeil neben „API-Adresse“, um zur Demoseite zu springen. Da das Modell groß ist, dauert es etwa 3 Minuten, bis die WebUI-Schnittstelle angezeigt wird, andernfalls wird „Bad Gateway“ angezeigt. Bitte beachten Sie, dass Benutzer vor der Verwendung der API-Adresszugriffsfunktion eine Echtnamenauthentifizierung durchführen müssen.

Effektanzeige

Laden Sie das Bild unter „Bild zum Bearbeiten hochladen“ hoch, geben Sie dann das Eingabewort in das Textfeld ein und klicken Sie abschließend zum Generieren auf „Ausführen“.

Einführung zur Parametereinstellung:

* Orientierungsskala: Wird verwendet, um den Einfluss bedingter Eingaben (wie Text oder Bild) auf die generierten Ergebnisse im generativen Modell zu steuern. Höhere Richtwerte führen dazu, dass die generierten Ergebnisse besser mit den Eingabebedingungen übereinstimmen, während niedrigere Werte mehr Zufälligkeit beibehalten.

* Anzahl der Inferenzschritte: Stellt die Anzahl der Modelliterationen oder Schritte im Inferenzprozess dar und stellt die Anzahl der Optimierungsschritte dar, die das Modell ausführt, um das Ergebnis zu generieren. Eine höhere Anzahl von Schritten führt im Allgemeinen zu genaueren Ergebnissen, kann aber die Rechenzeit verlängern.

* Samen: Zufallszahlen-Seed, der zur Steuerung der Zufälligkeit des Generierungsprozesses verwendet wird. Derselbe Seed-Wert kann dieselben Ergebnisse erzeugen (vorausgesetzt, dass die anderen Parameter gleich sind), was für die Reproduktion von Ergebnissen sehr wichtig ist.

Ich habe ein Porträtfoto hochgeladen mit der Aufforderung: Mach ihr Haar dunkelgrün und ihre Kleidung kariert. Der Effekt ist wie unten gezeigt ~