تم إصدار Sana في يناير 2025 ويتم قيادتها بشكل مشترك من قبل NVIDIA وMIT وجامعة Tsinghua. Sana هو إطار عمل لتحويل النص إلى صورة يمكنه إنشاء صور بدقة تصل إلى 4096 × 4096 بكفاءة. يمكن لبرنامج Sana تجميع صور عالية الدقة والجودة بسرعة كبيرة جدًا، مع إمكانيات قوية لمحاذاة النص والصورة. نتائج الورقة ذات الصلة هيSANA: تركيب صور عالي الدقة بكفاءة باستخدام محولات الانتشار الخطي"، وقد تم قبولها من قبل ICLR 2025.
يستخدم هذا البرنامج التعليمي نموذج Sana_1600M_1024px للتوضيح، وتستخدم موارد الحوسبة بطاقة 4090 واحدة.
2. خطوات التشغيل
1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب
إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. يرجى الانتظار لمدة 1-2 دقيقة ثم قم بتحديث الصفحة.
2. استخدم العرض التوضيحي
معلومات الاستشهاد
شكرًا لمستخدم Github سوبر يانغ لنشر هذا البرنامج التعليمي، معلومات مرجع المشروع هي كما يلي:
@misc{Sana2025,
title={Sana: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformer},
author={Enze Xie, Junsong Chen, Junyu Chen, Han Cai, Haotian Tang, Yujun Lin, Zhekai Zhang, Muyang Li, Ligeng Zhu, Yao Lu, Song Han},
howpublished={\url{https://nvlabs.github.io/Sana/}},
note={GitHub Repository with Code, Model & Documentation},
year={2025}
}
مناقشة
🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓