HyperAIHyperAI

Command Palette

Search for a command to run...

LongCat-Video: نموذج Meituan مفتوح المصدر لتوليد الفيديو بالذكاء الاصطناعي

1. مقدمة البرنامج التعليمي

يبني

LongCat-Video هو نموذج توليد فيديو مفتوح المصدر قائم على الذكاء الاصطناعي، يضم 13.6 مليار معلمة، طوّره فريق LongCat في Meituan. يتميز هذا النموذج ببراعة في مهام مثل تحويل النص إلى فيديو، وتحويل الصورة إلى فيديو، وتكملة الفيديو، وخاصةً في توليد مقاطع فيديو طويلة عالية الجودة بكفاءة. يستخدم النموذج تحسين التعلم التعزيزي متعدد المكافآت (GRPO)، ويُظهر أداءً يُضاهي نماذج توليد الفيديو مفتوحة المصدر الرائدة والحلول التجارية المتطورة في اختبارات المقارنة الداخلية والعامة. عنوان الورقة البحثية ذات الصلة هو "...".تقرير فني لفيديو LongCat".

يستخدم هذا البرنامج التعليمي وحدة معالجة رسومية واحدة RTX PRO 6000 لزيادة قوة الحوسبة. يُقدَّم أربعة أمثلة للاختبار: تحويل الصورة إلى فيديو، وتحويل النص إلى فيديو، والفيديو الطويل، واستمرار الفيديو.

2. عرض التأثير

1. تحويل الصورة إلى فيديو

2. تحويل النص إلى فيديو

3. إنشاء مقاطع فيديو طويلة

4. استمرار الفيديو

3. خطوات التشغيل

1. ابدأ تشغيل الحاوية

2. خطوات الاستخدام

إذا ظهرت رسالة "بوابة غير صالحة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لكبر حجم النموذج، يُرجى الانتظار لمدة 5-6 دقائق ثم تحديث الصفحة.

1. تحويل الصورة إلى فيديو

وصف المعلمة:

  • المطالبة السلبية: من خلال إدخال عناصر غير مرغوب فيها، فإنه يوجه النموذج لتجنب هذه الميزات، وبالتالي تحسين جودة المحتوى الناتج.
  • الدقة: تحدد أبعاد البكسل العرض × الارتفاع للصورة المولدة.
  • البذرة: تتحكم في نقطة بداية العشوائية في عملية التوليد. قيمة البذرة الثابتة تضمن نتائج قابلة للتكرار.

2. تحويل النص إلى فيديو

وصف المعلمة:

  • المطالبة السلبية: من خلال إدخال عناصر غير مرغوب فيها، فإنه يوجه النموذج لتجنب هذه الميزات، وبالتالي تحسين جودة المحتوى الناتج.
  • الارتفاع: يحدد ارتفاع الصورة التي تم إنشاؤها.
  • العرض: يحدد عرض الصورة التي تم إنشاؤها.
  • البذرة: تتحكم في نقطة بداية العشوائية في عملية التوليد. قيمة البذرة الثابتة تضمن نتائج قابلة للتكرار.

3. إنشاء مقاطع فيديو طويلة

يستغرق إنشاء الفيديو الطويل حوالي 20 دقيقة.

وصف المعلمة:

  • المطالبة السلبية: من خلال إدخال عناصر غير مرغوب فيها، فإنه يوجه النموذج لتجنب هذه الميزات، وبالتالي تحسين جودة المحتوى الناتج.
  • عدد المقاطع: كلما زاد عدد المقاطع، كلما كان الفيديو أطول.
  • البذرة: تتحكم في نقطة بداية العشوائية في عملية التوليد. قيمة البذرة الثابتة تضمن نتائج قابلة للتكرار.

4. استمرار الفيديو

يستغرق الفيديو التكميلي حوالي 20 دقيقة.

وصف المعلمة:

  • المطالبة السلبية: من خلال إدخال عناصر غير مرغوب فيها، فإنه يوجه النموذج لتجنب هذه الميزات، وبالتالي تحسين جودة المحتوى الناتج.
  • الدقة: تحدد أبعاد البكسل العرض × الارتفاع للصورة المولدة.
  • البذرة: تتحكم في نقطة بداية العشوائية في عملية التوليد. قيمة البذرة الثابتة تضمن نتائج قابلة للتكرار.

معلومات الاستشهاد

معلومات الاستشهاد لهذا المشروع هي كما يلي:

@misc{meituanlongcatteam2025longcatvideotechnicalreport,
      title={LongCat-Video Technical Report}, 
      author={Meituan LongCat Team and Xunliang Cai and Qilong Huang and Zhuoliang Kang and Hongyu Li and Shijun Liang and Liya Ma and Siyu Ren and Xiaoming Wei and Rixu Xie and Tong Zhang},
      year={2025},
      eprint={2510.22200},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2510.22200}, 
}

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp