LTX-Video13B: طفرة في توليد الفيديو بدقته العالية وسرعته المتميزة تصل إلى 30 ضعف
لقد حققت تقنية توليد الفيديو باستخدام الذكاء الاصطناعي خطوة كبيرة نحو الأمام! أعلنت شركة Lightricks مؤخرًا عن إطلاق نموذج LTX-Video13B الجديد والمفتوح المصدر، والذي يتميز بـ13 مليار معلمة، سرعة توليد تبلغ 30 مرة أسرع من النماذج المنافسة، وتكنولوجيا تضليل متعددة المقاييس مبتكرة، مما جعله محور اهتمام الصناعة. التقنية المبتكرة: تضليل متعدد المقاييس يعيد تشكيل توليد الفيديو يعتمد نموذج LTX-Video13B على تقنية تضليل متعددة المقاييس فريدة من نوعها. بدلاً من توليد الفيديو بدقة عالية من البداية، يقوم هذا النموذج بتوليد حركات وترتيب المشاهد الأساسية بدقة منخفضة أولاً، ثم يركز تدريجيًا على تحسين التفاصيل. هذه الطريقة تتيح له زيادة السرعة بنسبة تصل إلى 30 مرة مقارنة بالنموذج التقليدي، حيث يمكنه توليد خمس ثوانٍ من الفيديو في أقل من ثانيتين. كما يتميز بحاجته إلى ذاكرة أقل، مما يسهل تشغيله على بطاقات الرسومات المستهلكة مثل NVIDIA RTX4090. يُبنى النموذج على هندسة DiT (Transformer للانتشار)، والتي تتكامل مع تحسينات النواة المتقدمة وتنسيق البيانات bfloat16، مما يعزز أدائه بشكل كبير. يدعم LTX-Video13B توليد الفيديو في دقة 1216×704 وبمعدل 30 إطارًا في الثانية، وهو مناسب لعدة أنماط توليدية مثل تحويل النص إلى فيديو، الصورة إلى فيديو، وفيديو إلى فيديو. هذا يلبي مجموعة متنوعة من احتياجات الإبداع. الوظائف القوية: التحكم الدقيق والإبداع اللامحدود يتميز LTX-Video13B بأدائه الممتاز في فهم الحركة المتصلة، بناء المشاهد، وعلاقات الكاميرا، مما يسمح بإنتاج محتوى فيديو منطقي وغني بالتفاصيل. يوفر النموذج التحكم الدقيق في العناصر الأساسية للفيديو، مثل الإطارات الرئيسية، حركة الشخصيات، وتركيبات الكاميرا المتعددة. على سبيل المثال، يمكن للمبدعين تعديل حركات الشخصيات، الانتقال بين المشاهد، أو زاوية الكاميرا باستخدام إشارات نصية أو صور مرجعية، لتحقيق تأثيرات سينمائية رائعة. بالإضافة إلى ذلك، يدعم النموذج وظائف تمديد الفيديو وتغيير الأسلوب والحركات. يمكن للمستخدمين تمديد مقاطع الفيديو الموجودة إلى ما يصل إلى 60 ثانية، أو تطبيق معالجات تجميلية مثل تحويل مشاهد واقعية إلى نمط رسوم متحركة. هذه المرونة تجعله مناسبًا للإنتاج السينمائي، الإعلان الإبداعي، وإنشاء محتوى وسائل التواصل الاجتماعي. النظام المفتوح: تمكين المطورين والمبدعين بصفته نموذجًا مفتوح المصدر، يتاح LTX-Video13B مجانًا على منصات GitHub و Hugging Face، مما يسمح للمطورين والمبدعين بإجراء التعديلات والتخصيصات حسب الحاجة. بالإضافة إلى ذلك، قدمت Lightricks أداة LTX-Video-Trainer، التي تدعم تدريب النماذج بدقة 2 مليار و13 مليار معلمة، بالإضافة إلى تدريب LoRA (التكيف منخفض الرتبة)، مما يسهل على المستخدمين تطوير نماذج التحكم المخصصة مثل الكشف عن العمق، الوضع، أو الحواف. يتوافق النموذج أيضًا مع سير العمل ComfyUI، حيث يوفر وحدة Looping Sampler الجديدة لدعم توليد مقاطع فيديو من أي طول مع الحفاظ على التناقض الحركي. لتخفيض عتبة الاستخدام، أصدرت Lightricks مجموعة من الأدوات المساعدة، مثل الإصدار المُكمم بـ8 بت (ltxv-13b-fp8) وأداة IC-LoRA Detailer، لتحسين الأداء على الأجهزة ذات الذاكرة المنخفضة. كما تم توفير النموذج مجانًا للشركات الناشئة والمنظمات التي تحقق إيرادات سنوية أقل من 10 مليون دولار، مما يعكس التزام Lightricks بتعزيز ديمقراطية الذكاء الاصطناعي. علامة فارقة جديدة في توليد الفيديو AI يعتقد موقع AIbase أن إطلاق LTX-Video13B يمثل نقطة تحول مهمة في مجال توليد الفيديو المفتوح المصدر. بفضل تقنيته لتضليل متعدد المقاييس وتحسينه للأجهزة المستهلكة، فقد أزال الحاجة إلى الأجهزة عالية الأداء، مقدمًا أدوات احترافية للمجموعات الصغيرة والمتوسطة والمبدعين الأفراد. وبالنظر إلى التعاون داخل المجتمع المفتوح المصدر، يمكن أن يدفع LTX-Video13B تقنية توليد الفيديو نحو المزيد من الابتكارات ويُستغل في مجالات متنوعة مثل السينما، الألعاب، الإعلانات، والتعليم. المستقبل: فتح فصل جديد في إبداع الفيديو باستخدام الذكاء الاصطناعي أكدت Lightricks أن تطوير LTX-Video13B استفاد من مجموعات البيانات عالية الجودة المقدمة من شركاء مثل Getty Images، مما ضمان تجربة تجارية آمنة وجاذبية بصريًا. تعتزم الشركة استكشاف تقنيات التحذير الزمني والتوليد متعدد الأوضاع في المستقبل لدعم احتياجات إبداعية أكثر تعقيدًا. يأمل موقع AIbase أن يصبح LTX-Video13B معيارًا في مجال توليد الفيديو بالذكاء الاصطناعي بفضل الدفع الذي سيحصل عليه من المجتمع المفتوح المصدر. يمكن للمستخدمين الحصول على النموذج وتوثيقه عبر الموقع الرسمي لـ LTX Studio (https://ltx.studio) أو GitHub (https://github.com/Lightricks/LTX-Video). تخطط Lightricks لمواصلة تحسين النموذج ودعم المزيد من أنواع التحكم والوظائف متعددة الأوضاع، لتزويد المبدعين بأدوات أكثر قوة.