TransPixeler هي طريقة لإنشاء نص إلى فيديو تم إصدارها بواسطة الجامعة الصينية في هونج كونج وجامعة هونج كونج للعلوم والتكنولوجيا وAdobe Research في عام 2025. تحتفظ هذه الطريقة بمزايا نموذج RGB الأصلي وتحقق محاذاة قوية بين قنوات RGB وقنوات ألفا باستخدام بيانات تدريب محدودة. يمكنه إنشاء مقاطع فيديو RGBA متنوعة ومتسقة بشكل فعال، وبالتالي تعزيز إمكانية التأثيرات المرئية وإنشاء المحتوى التفاعلي. نتائج الورقة ذات الصلة هيTransPixeler: تطوير تحويل النصوص إلى مقاطع فيديو مع الشفافية"، كان CVPR 2025 يقبل.
يستخدم هذا البرنامج التعليمي مورد A6000 ببطاقة واحدة، ووصف النص يدعم اللغة الإنجليزية فقط في الوقت الحالي.
2. أمثلة المشاريع
3. خطوات التشغيل
1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب
إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 1-2 دقيقة وتحديث الصفحة.
2. بعد الدخول إلى صفحة الويب، يمكنك بدء محادثة مع النموذج
وصف المعلمة:
البذرة: بذرة رقم عشوائي، تستخدم للتحكم في عشوائية عملية التوليد. يمكن لقيمة البذرة نفسها أن تنتج نفس النتائج (بشرط أن تكون المعلمات الأخرى هي نفسها)، وهو أمر مهم للغاية في إعادة إنتاج النتائج.
كيفية الاستخدام
4. المناقشة
🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓
معلومات الاستشهاد
شكرًا لمستخدم Github xxxجججج1 نشر هذا البرنامج التعليمي. معلومات الاستشهاد لهذا المشروع هي كما يلي:
@misc{wang2025transpixeler,
title={TransPixeler: Advancing Text-to-Video Generation with Transparency},
author={Luozhou Wang and Yijun Li and Zhifei Chen and Jui-Hsien Wang and Zhifei Zhang and He Zhang and Zhe Lin and Ying-Cong Chen},
year={2025},
eprint={2501.03006},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2501.03006},
}