MIT وAdobe يطوران أداة فيديو AI جديدة: جودة عالية وإمكانية التعديل الفوري
الفريق البحثي من معهد ماساتشوستس للتكنولوجيا (MIT) وشركة أدوبه (Adobe) تعاونا على تطوير أداة جديدة تعتمد على الذكاء الصناعي لإنشاء مقاطع الفيديو، حيث تتميز جودة الفيديوهات المنتجة بمعدل 10 ثوانٍ بمستوى ينافس الأدوات المشهورة مثل "OpenSORA" و "MovieGen". هذه الأداة الجديدة، التي تُعرف باسم CausVid، تتفوق في سرعة إنتاج الفيديوهات بـ100 ضعف، مع الحفاظ على الجودة والثبات. خلال الاختبارات التي أجريت لتحديد الثبات والاستقرار، تم اختبار CausVid على مقاطع فيديو بطول 30 ثانية، وأظهرت النتائج أن هذه التقنية قادرة على إنتاج مقاطع فيديو مستقرة وجودة عالية في فترات زمنية قصيرة جدًا، مما يجعلها مناسبة لإنشاء مقاطع فيديو طويلة بشكل مستمر. وقد أشار الباحث Tianwei Yin إلى أن "هذه الأداة تجمع بين سرعة الذكاء الصناعي وجودة الفيديو، رغم أنها تستغرق وقتًا أقل في الإنتاج، فإنها تقدم تنوعًا أكبر في المشاهد والحركة". في مقارنة مع الأدوات الأخرى مثل "Vchitect" و "Gen-3"، حصلت CausVid على تقييم متوسط بلغ 84.27 من المستخدمين البالغ عددهم 900 في الاختبارات التي أجريت باستخدام مجموعة بيانات النص-فيديو. كانت هذه النتائج متميزة، خاصة فيما يتعلق بجودة الصور المتحركة ودقة الحركة. بالرغم من أن CausVid تعد تقنية متقدمة في مجال إنشاء الفيديو بالذكاء الصناعي، فإن الباحثين يهدفون إلى تحسين بنية النظام لتوفير سرعة إنتاج أسرع، وحتى إمكانية التلاعب الفوري بالفيديو أثناء إنتاجه. قال Tianwei Yin أيضًا إن استخدام بيانات تدريب محددة يمكن أن يساعد في إنتاج محتوى فيديو أكثر جودة للصناعات مثل الروبوتات والألعاب. وفقًا للمشرف على الدراسة Jun Yan Zhu من جامعة كارنيجي ميلون، فإن هذا النظام الهجين يعتبر ترقية مهمة للنماذج الموسعة الحالية التي تعاني من بطء في معالجة البيانات. أضاف Zhu أن "النماذج الحالية لإنشاء الفيديو تفتقر للسرعة المطلوبة مقارنة بالنماذج اللغوية أو الصورية، وهذا العمل يحقق تقدمًا كبيرًا في سرعة الإنتاج، مما يفتح المجال لتطبيقات تفاعلية أقوى وتيارات بيانات أسرع". حصلت هذه الدراسة على دعم من مركز أبحاث ماساتشوستس، ومعهد العلوم والتكنولوجيا في بيكين، وشركة أدوبه، ومختبرات أبحاث غوغل، ومكتب أبحاث القوات الجوية الأمريكية، وشركة إنفيديا. ومن المقرر أن يتم تقديم تقنية CausVid في المؤتمر الدولي للرؤية بواسطة الحاسوب وتعرف النموذج (CVPR) في يونيو من العام الحالي. بالرغم من التقدم الكبير الذي حققته CausVid، إلا أن الباحثين يواصلون العمل للوصول إلى مستوى أعلى من الدقة والتنوع في الإنتاج، مع الحفاظ على السرعة والكفاءة. تعتبر هذه التقنية خطوة مهمة نحو تحقيق إنتاج فيديو فوري وعالي الجودة، مما يمكن أن يغير الطريقة التي ننتج بها المحتوى البصري في المستقبل.