1. Einführung in das Tutorial

Sana, veröffentlicht im Januar 2025, ist ein gemeinsames Projekt von NVIDIA, dem MIT und der Tsinghua-Universität. Sana ist ein Text-zu-Bild-Framework, das effizient Bilder mit einer Auflösung von bis zu 4096 × 4096 Pixeln erzeugen kann. Sana synthetisiert hochauflösende, qualitativ hochwertige Bilder sehr schnell und verfügt über leistungsstarke Funktionen zur Text-Bild-Ausrichtung. Zugehörige Forschungsarbeiten umfassen… SANA: Effiziente hochauflösende Bildsynthese mit linearen DiffusionstransformatorenEs wurde von der ICLR 2025 akzeptiert.

Dieses Tutorial verwendet zur Demonstration das Modell Sana_1600M_1024px und die Rechenressourcen verwenden eine einzelne 4090-Karte.

Zitationsinformationen

Dank an den Github-Benutzer SuperYang Für die Bereitstellung dieses Lernprogramms lauten die Projektreferenzinformationen wie folgt:

@misc{Sana2025, title={Sana: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformer}, author={Enze Xie, Junsong Chen, Junyu Chen, Han Cai, Haotian Tang, Yujun Lin, Zhekai Zhang, Muyang Li, Ligeng Zhu, Yao Lu, Song Han}, howpublished={\url{https://nvlabs.github.io/Sana/}}, note={GitHub Repository with Code, Model & Documentation}, year={2025} }

Diskussion

🖌️ Wenn Sie ein hochwertiges Projekt sehen, hinterlassen Sie bitte im Hintergrund eine Nachricht, um es weiterzuempfehlen! Darüber hinaus haben wir auch eine Tutorien-Austauschgruppe ins Leben gerufen. Willkommen, Freunde, scannen Sie den QR-Code und kommentieren Sie [SD-Tutorial], um der Gruppe beizutreten, verschiedene technische Probleme zu besprechen und Anwendungsergebnisse auszutauschen ↓

HyperAI

Dieses Notebook ausführen Auf Discord diskutieren

Datum

vor 9 Monaten

Größe

312.05 MB

1. Einführung in das Tutorial

Dieses Tutorial verwendet zur Demonstration das Modell Sana_1600M_1024px und die Rechenressourcen verwenden eine einzelne 4090-Karte.

2. Bedienungsschritte

1. Klicken Sie nach dem Starten des Containers auf die API-Adresse, um die Weboberfläche aufzurufen

Wenn „Bad Gateway“ angezeigt wird, bedeutet dies, dass das Modell initialisiert wird. Bitte warten Sie etwa 1–2 Minuten und aktualisieren Sie die Seite.

2. Nutzen Sie die Demonstration

Zitationsinformationen

Dank an den Github-Benutzer SuperYang Für die Bereitstellung dieses Lernprogramms lauten die Projektreferenzinformationen wie folgt:

@misc{Sana2025,
  title={Sana: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformer},
  author={Enze Xie, Junsong Chen, Junyu Chen, Han Cai, Haotian Tang, Yujun Lin, Zhekai Zhang, Muyang Li, Ligeng Zhu, Yao Lu, Song Han},
  howpublished={\url{https://nvlabs.github.io/Sana/}},
  note={GitHub Repository with Code, Model & Documentation},
  year={2025}
}

Diskussion

Dieses Notebook wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Bei urheberrechtlichen Bedenken kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Verwandt Notebooks

Z-Image-Turbo: Ein Hocheffizientes 6B-Parameter-Bildgenerierungsmodell

vor 2 Monaten

Kiss3DGen: Ein Framework Zur Generierung Von 3D-Assets Basierend Auf Einem Bilddiffusionsmodell

vor einem Monat

SoulX-Podcast: Generierung Von Langtexten in Podcast-Qualität Für Verschiedene Dialekte.

vor 2 Monaten

Depth-Anything-3: Wiederherstellung Des Visuellen Raums Aus Jeder Perspektive

vor 2 Monaten

SAM3: Visuelles Segmentierungsmodell

vor 2 Monaten

Krea-realtime-video: Echtzeit-Videogenerierungsmodell

vor 3 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Dieses Notebook ausführen Auf Discord diskutieren

Datum

vor 9 Monaten

Größe

312.05 MB

1. Einführung in das Tutorial

Dieses Tutorial verwendet zur Demonstration das Modell Sana_1600M_1024px und die Rechenressourcen verwenden eine einzelne 4090-Karte.

2. Bedienungsschritte