HyperAIHyperAI

Hunyuan-GameCraft-1.0: إطار عمل لإنشاء مقاطع فيديو الألعاب التفاعلية

1. مقدمة البرنامج التعليمي

يبني

Hunyuan-GameCraft-1.0 هو إطار عمل ديناميكي للغاية لإنشاء فيديوهات الألعاب التفاعلية، أُطلق بالتعاون بين فريق Tencent Hunyuan وجامعة Huazhong للعلوم والتكنولوجيا في أغسطس 2025. يعتمد الإطار على توحيد مدخلات لوحة المفاتيح والفأرة في مساحة تمثيل كاميرا مشتركة، مما يُحقق تحكمًا دقيقًا في الحركة ويدعم المدخلات التفاعلية المعقدة. يُقدم الإطار استراتيجية تدريب لحالة التاريخ المختلط، والتي تُمكّن من توسيع تسلسلات الفيديو تلقائيًا، والاحتفاظ بمعلومات مشهد اللعبة، وضمان اتساق زمني طويل الأمد. بالاعتماد على تقنية تقطير النماذج، يُحسّن Hunyuan-GameCraft-1.0 سرعة الاستدلال بشكل كبير، وهو مناسب للنشر الفوري في بيئات تفاعلية معقدة. تم تدريب النموذج على مجموعة بيانات ألعاب AAA واسعة النطاق، وأظهر دقة بصرية ممتازة، وأصالة، وإمكانية تحكم في الحركة، متفوقًا بشكل كبير على النماذج الحالية. نتائج البحث ذات الصلة هي:Hunyuan-GameCraft: إنشاء فيديو لعبة تفاعلية عالية الديناميكية مع شرط التاريخ الهجين".

يستخدم هذا البرنامج التعليمي أربع بطاقات رسومية RTX 4090 كموارد حوسبة.

2. عرض التأثير

3. خطوات التشغيل

1. ابدأ تشغيل الحاوية

2. خطوات الاستخدام

إذا ظهرت رسالة "بوابة غير صالحة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لكبر حجم النموذج، يُرجى الانتظار لمدة 5-6 دقائق تقريبًا ثم تحديث الصفحة. تأكد من اكتمال تهيئة النموذج قبل تشغيل واجهة Gradio.

ملاحظة: كلما زادت خطوات الاستدلال/إطارات الفيديو، كان التأثير الناتج أفضل، ولكن وقت توليد الاستدلال أطول. يُرجى ضبط خطوات الاستدلال/إطارات الفيديو بشكل مناسب (عندما تكون خطوات الاستدلال 5 وإطارات الفيديو 33، يستغرق توليد الفيديو حوالي 15 دقيقة).

المعلمات المحددة:

  • تحديد الإجراءات (قائمة الإجراءات):
    • للأمام: التحرك للأمام في خط مستقيم على طول الاتجاه الحالي (مباشرة أمام الكاميرا/الناقل) دون تغيير الاتجاه.
    • يسار: التحرك أفقيًا إلى يسار الاتجاه الحالي دون تغيير الاتجاه.
    • يمين: التحرك أفقيًا إلى يمين الاتجاه الحالي دون تغيير الاتجاه.
    • للخلف: التحرك للخلف في خط مستقيم في الاتجاه المعاكس للاتجاه الحالي دون تغيير الاتجاه.
    • دوران لأعلى: يُدوّر زاوية العرض/الميل لأعلى حول المحور الأفقي (الميل ↑). يُغيّر اتجاه العرض فقط، وليس الموضع.
    • right_rot: تدوير الكاميرا إلى اليمين حول المحور الرأسي (yaw →)، مما يؤدي إلى تغيير الاتجاه فقط، وليس الموضع.
    • left_rot: تدوير الكاميرا إلى اليسار حول المحور الرأسي (yaw ←)، مما يؤدي إلى تغيير الاتجاه فقط، وليس الموضع.
    • down_rot: تدوير زاوية العرض/الميل إلى الأسفل حول المحور الأفقي (pitch↓)، مما يؤدي إلى تغيير اتجاه العرض فقط، وليس الموضع.
  • مقياس CFG: يتحكم في تأثير الكلمة المطلوبة على النتيجة المُولَّدة. كلما كبرت القيمة، زادت ملاءمتها للكلمة المطلوبة.
  • عينة N إطارات: العدد الإجمالي لإطارات الفيديو الذي تم إنشاؤه.
  • خطوات الاستدلال: عدد خطوات التحسين التكرارية لإنشاء الفيديو.
  • تقييم تدفق التحول للفيديو: المعلمات التي تتحكم في سلاسة الفيديو.

4. المناقشة

🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓

معلومات الاستشهاد

شكرًا لمستخدم Github سوبر يانغ  نشر هذا البرنامج التعليمي. معلومات الاستشهاد لهذا المشروع هي كما يلي:

@misc{li2025hunyuangamecrafthighdynamicinteractivegame,
    title={Hunyuan-GameCraft: High-dynamic Interactive Game Video Generation with Hybrid History Condition}, 
    author={Jiaqi Li and Junshu Tang and Zhiyong Xu and Longhuang Wu and Yuan Zhou and Shuai Shao and Tianbao Yu and Zhiguo Cao and Qinglin Lu},
    year={2025},
    eprint={2506.17201},
    archivePrefix={arXiv},
    primaryClass={cs.CV},
    url={https://arxiv.org/abs/2506.17201}, 
}