عرض توضيحي لنموذج انتشار الفيديو Vchitect-2.0
نظرة عامة على المشروع
Vchitect-2.0 هو نظام لتوليد الفيديو عالي الجودة تم تطويره بواسطة فريق مختبر الذكاء الاصطناعي في شنغهاي في سبتمبر 2024. يستخدم النموذج تصميمًا مبتكرًا لهندسة المحولات المتوازية مع 2 مليار معلمة ويمكنه إنشاء محتوى فيديو سلس وعالي الجودة بناءً على مطالبات نصية.Vchitect-2.0: محول متوازي لتوسيع نطاق نماذج انتشار الفيديو".
يستخدم هذا البرنامج التعليمي الموارد لبطاقة واحدة A6000.
خطوات التشغيل
1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب
إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 1-2 دقيقة وتحديث الصفحة.

2. بمجرد دخولك إلى صفحة الويب، يمكنك التفاعل مع النموذج
لإنشاء فيديو، يجب إدخال نص موجه. يدعم النص اللغة الإنجليزية فقط. يمكن أن يكون طول النص بأي طول، ولكن يُنصح بألا يتجاوز 100 حرف، وإلا فقد يكون الفيديو المُنشأ طويلاً جدًا ويؤثر على جودته. يجب الانتظار لمدة دقيقتين إلى خمس دقائق تقريبًا، لذا يُرجى التحلي بالصبر.

التبادل والمناقشة
🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓

معلومات الاستشهاد
شكرًا لمستخدم Github com.zhangjunchang لنشر هذا البرنامج التعليمي، معلومات مرجع المشروع هي كما يلي:
@article{fan2025vchitect,
title={Vchitect-2.0: Parallel Transformer for Scaling Up Video Diffusion Models},
author={Fan, Weichen and Si, Chenyang and Song, Junhao and Yang, Zhenyu and He, Yinan and Zhuo, Long and Huang, Ziqi and Dong, Ziyue and He, Jingwen and Pan, Dongwei and others},
journal={arXiv preprint arXiv:2501.08453},
year={2025}
}