HyperAIHyperAI

Online-Tutorial: Qwen-Image Aktualisiert Den Stand Der Bildbearbeitung Und Erzielt Eine Genaue Chinesische Darstellung

特色图像

Kürzlich,Das Ali Tongyi Qianwen-Team hat das erste grundlegende Bildgenerierungsmodell Qwen-Image als Open Source veröffentlicht.Die Anzahl der Parameter erreicht 20 B und es wird die neue MMDiT-Architektur übernommen, die das SOTA der Bilderzeugungsmodelle aktualisiert.

Qwen-Image konzentriert sich auf die Verbesserung der KI-Fähigkeiten in zwei Kernszenarien: komplexes Text-Rendering und präzise Bildbearbeitung.Ob Slogan auf einem Plakat, langer Absatz in einer PPT oder poetische Atmosphäre in einem alten Buch – Qwen-Image kann diese dank seiner hervorragenden Rendering-Funktionen mit hervorragender Schriftform, Satz und Semantik sowohl auf Chinesisch als auch auf Englisch präzise darstellen. Die Textwiedergabe wurde in mehreren Bewertungslisten mit SOTA ausgezeichnet. Besonders hervorzuheben ist, dass die leistungsstarke Leistung von Qwen-Image bei der chinesischen Wiedergabe eine wertvolle Ergänzung zum Aufbau chinesischer Fähigkeiten in Open-Source-Bildmodellen darstellt und eine natürlichere Einbettung von Chinesisch in das Bildmodell-Rendering-System ermöglicht.Die Genauigkeit der Einzelwortwiedergabe erreicht 58,3% und bietet eine zuverlässige Wahl für Anwendungsszenarien, die eine genaue chinesische Ausgabe erfordern.

In Bezug auf die Bildbearbeitung bietet Qwen-Image leistungsstarke mehrdimensionale Funktionen.Es unterstützt nicht nur grundlegende Vorgänge wie Stilübertragung, Hinzufügen, Löschen und Ändern, sondern ermöglicht auch detaillierte Funktionen wie lokale Änderungen und Anpassung der Zeichenhaltung.Selbst Gelegenheitsanwender können mit Qwen-Image problemlos professionelle Bildbearbeitungsergebnisse erzielen. Durch die Kettenbearbeitung erhält das Modell leistungsstarke „Memory Anchoring“-Funktionen, wodurch die Konsistenz der Subjekt-ID auch nach mehreren Änderungsrunden erhalten bleibt und der Aufwand für „Bearbeitung nach Bearbeitung, Änderung nach Änderung“ entfällt.

Qwen-Image: Ein Bildmodell mit erweiterten Text-Rendering-FunktionenJetzt im Bereich „Tutorials“ der offiziellen HyperAI-Website (hyper.ai) verfügbar. Setzen Sie es jetzt ein und erzielen Sie ganz einfach professionelle Ergebnisse!

Link zum Tutorial:

https://go.hyper.ai/jmfJQ

Demolauf

1. Wählen Sie auf der Homepage von hyper.ai die Seite „Tutorials“ aus, wählen Sie „Qwen-Image: Ein Bildmodell mit erweiterter Textwiedergabe“ und klicken Sie auf „Dieses Tutorial online ausführen“.

2. Klicken Sie nach dem Seitensprung oben rechts auf „Klonen“, um das Tutorial in Ihren eigenen Container zu klonen.

3. Wählen Sie die NVIDIA RTX A6000 48 GB und PyTorch-Images aus, wählen Sie je nach Bedarf den Pay-As-You-Go- oder Tages-/Wochen-/Monatstarif und klicken Sie auf „Weiter“. Neue Benutzer können sich über den unten stehenden Einladungslink registrieren und erhalten 4 Stunden kostenlose RTX 4090 und 5 Stunden kostenlose CPU-Zeit!

Exklusiver Einladungslink von HyperAI (kopieren und im Browser öffnen):

https://openbayes.com/console/signup?r=Ada0322_NR0n

4. Warten Sie, bis die Ressourcen zugewiesen sind. Der erste Klonvorgang dauert etwa 3 Minuten. Wenn der Status auf „Läuft“ wechselt, klicken Sie auf den Pfeil neben „API-Adresse“, um zur Demoseite zu gelangen. Bitte beachten Sie, dass Benutzer vor der Verwendung der API-Adresse eine Echtnamen-Authentifizierung durchführen müssen.

Effektdemonstration

Geben Sie nach dem Aufrufen der Ausführungsseite „Eingabeaufforderung“ in das Eingabefeld ein. Unter „Erweiterte Einstellungen“ können Sie erweiterte Parameter festlegen und die Ausführung starten. Nach meinen praktischen Tests sind die Textwiedergabefunktionen von Qwen-Image tatsächlich sehr leistungsstark und ermöglichen eine stabile, präzise Schriftform und einen sauberen Schriftsatz.

Prompt:Ein Mädchen im Anime-Stil mit zartem Anime-Gesicht, funkelnden Augen, langen rosa Haaren und einer weißen Schleife. Sie hält ein leuchtendes Pergament mit der sauber handgeschriebenen Botschaft „Qwen-Image-Modell Open Source, bedeutender Fortschritt bei komplexer Textdarstellung und präziser Bildbearbeitung“. Sie trägt die Uniform einer Zauberakademie. Der Hintergrund ist eine Sternenstudie mit einem schwebenden Zauberbuch und Partikellichteffekten. Das Kunstwerk ist im Ghibli-Stil gehalten, mit einem weichen Lichtfilter und Tiefenschärfe.

Hinweis: Dieses Poster zeigt ein Grafikdesign mit einem weichen, abgestuften Hintergrund in der Morandi-Farbpalette. Die Grundfarbpalette ist eine gräulich-rosa Basis mit Übergängen von Dunstrosa und Haferflockenweiß. Der Kerntext ist zentriert. „Qwen-Image: Ein Bildmodell mit erweiterten Text-Rendering-Funktionen“ ist jetzt im Bereich „Tutorials“ der offiziellen HyperAI-Website (hyper.ai) verfügbar. Jetzt einsetzen für professionelle Ergebnisse! Dekorative Elemente bestehen aus abstrakten geometrischen Linien, die von der Grundfarbpalette ausgehen. Ein Anime-Roboter im Cartoon-Stil bildet den Kontrast zum Hintergrund und ergänzt die subtilen Lichtpartikel und die zerknitterte Papierstruktur. Die Textkanten sind scharf und frei von gezackten Kanten.

Das Obige ist das diesmal von HyperAI empfohlene Tutorial. Jeder ist herzlich eingeladen, vorbeizukommen und es auszuprobieren!

Link zum Tutorial:

https://go.hyper.ai/jmfJQ