LTX-Video's ltxv-13b-0.9.7-distilled هو أحدث إصدار من نموذج التقطير الذي أصدرته Lightricks في 14 مايو 2025. يستخدم النموذج المحول وتقنية Video-VAE لتوليد مقاطع فيديو عالية الدقة بكفاءة. نقوم بإنشاء مقطع فيديو مدته 5 ثوانٍ بمعدل 24 إطارًا في الثانية بدقة 768×512 في ثانيتين فقط على وحدة معالجة الرسوميات Nvidia H100، متفوقين على جميع النماذج الموجودة ذات الحجم المماثل. بالإضافة إلى ذلك، يدعم LTX-Video طرق متعددة لإنشاء الفيديو، بما في ذلك من النص إلى الفيديو، ومن الصورة إلى الفيديو، والفيديو الموسع، وتوليد الفيديو مع شروط متعددة. نتائج الورقة ذات الصلة هيLTX-Video: الانتشار الكامن للفيديو في الوقت الفعلي".
يستخدم هذا البرنامج التعليمي مورد حوسبة A6000 واحد ويوفر مثالين لتحويل النص إلى فيديو وتحويل الصورة إلى فيديو للاختبار.
2. عرض التأثير
تحويل النص إلى فيديو:
الصورة إلى فيديو:
3. خطوات التشغيل
1. ابدأ تشغيل الحاوية
إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 2-3 دقائق وتحديث الصفحة.
2. أمثلة الاستخدام
يدعم البرنامج اللغة الإنجليزية فقط.
1. تحويل الصورة إلى فيديو
المعلمات المحددة:
تحميل الصورة: هنا يمكنك تحميل صورة كنقطة بداية لإنشاء الفيديو.
المطالبة: يمكنك إدخال نص لوصف محتوى الفيديو هنا، وسوف يقوم النموذج بإنشاء مقطع فيديو بناءً على هذا النص.
مدة الفيديو: حدد طول الفيديو الذي تم إنشاؤه.
المطالبة السلبية: هنا يمكنك إدخال العناصر أو الميزات التي لا تريد ظهورها في الفيديو، مما يساعد على تجنب إنشاء تأثيرات غير مرغوب فيها.
البذرة: هذا الرقم يحدد عشوائية إنشاء الفيديو.
مقياس التوجيه (CFG): يتحكم في مقدار تأثير الإرشادات على الإخراج. القيم الأعلى لها تأثير أكبر.
الارتفاع: الارتفاع، يجب أن يكون قابلاً للقسمة على 32.
العرض: العرض، يجب أن يكون قابلاً للقسمة على 32.
نتيجة
2. تحويل النص إلى فيديو
المعلمات المحددة:
المطالبة: يمكنك إدخال نص لوصف محتوى الفيديو هنا، وسوف يقوم النموذج بإنشاء مقطع فيديو بناءً على هذا النص.
مدة الفيديو: حدد طول الفيديو الذي تم إنشاؤه.
المطالبة السلبية: هنا يمكنك إدخال العناصر أو الميزات التي لا تريد ظهورها في الفيديو، مما يساعد على تجنب إنشاء تأثيرات غير مرغوب فيها.
البذرة: هذا الرقم يحدد عشوائية إنشاء الفيديو.
مقياس التوجيه (CFG): يتحكم في مقدار تأثير الإرشادات على الإخراج. القيم الأعلى لها تأثير أكبر.
الارتفاع: الارتفاع، يجب أن يكون قابلاً للقسمة على 32.
العرض: العرض، يجب أن يكون قابلاً للقسمة على 32.
النتيجة الناتجة
4. المناقشة
🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓
معلومات الاستشهاد
معلومات الاستشهاد لهذا المشروع هي كما يلي:
@article{HaCohen2024LTXVideo,
title={LTX-Video: Realtime Video Latent Diffusion},
author={HaCohen, Yoav and Chiprut, Nisan and Brazowski, Benny and Shalem, Daniel and Moshe, Dudu and Richardson, Eitan and Levin, Eran and Shiran, Guy and Zabari, Nir and Gordon, Ori and Panet, Poriya and Weissbuch, Sapir and Kulikov, Victor and Bitterman, Yaki and Melumian, Zeev and Bibi, Ofir},
journal={arXiv preprint arXiv:2501.00103},
year={2024}
}