HyperAIHyperAI

Command Palette

Search for a command to run...

HuMo-17B: الإبداع التعاوني ثلاثي الوسائط

1. مقدمة البرنامج التعليمي

نجوم جيثب

HuMo هو إطار عمل متعدد الوسائط لتوليد الفيديو، أطلقته جامعة تسينغهوا ومختبر بايت دانس للإنشاء الذكي في سبتمبر 2025، ويركز على توليد فيديو يركز على الإنسان. يمكنه توليد مقاطع فيديو عالية الجودة، مفصلة، وقابلة للتحكم، من مدخلات متعددة الوسائط، مثل النصوص والصور والصوت. يدعم HuMo إمكانيات قوية لمتابعة النص، وحفظًا متسقًا للموضوع، ومزامنة حركة الصوت. يدعم أيضًا توليد الفيديو من نص-صورة (VideoGen من Text-Image)، ونص-صوت (VideoGen من Text-Audio)، ونص-صورة-صوت (VideoGen من Text-Image-Audio). نتائج البحث ذات الصلة هي:HuMo: إنشاء فيديو يركز على الإنسان من خلال التكييف التعاوني متعدد الوسائط".

يوفر مشروع HuMo نشر النماذج بمواصفاتين: 1.7B و17B. يستخدم هذا البرنامج التعليمي نموذج 17B وبطاقة RTX pro 6000 واحدة كمورد.

→ انقر للانتقال إلى التجربةHuMo 1.7B: إطار عمل لتوليد الفيديو متعدد الوسائط".

2. أمثلة المشاريع

VideoGen من Text-Image-Audio،TIA

VideoGen من Text-Audio،TA

3. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب

2. خطوات الاستخدام

إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 2-3 دقائق وتحديث الصفحة.  ملاحظة: عند ضبط خطوات أخذ العينات على 10، يستغرق الأمر ما يقرب من 3 إلى 5 دقائق لتوليد النتائج.

تيا

تا

وصف المعلمة

  • الارتفاع: تعيين ارتفاع الفيديو.
  • العرض: تعيين عرض الفيديو.
  • الإطارات: قم بتعيين عدد إطارات الفيديو.
  • مقياس توجيه النص: مقياس توجيه النص، المستخدم للتحكم في تأثير المطالبات النصية على إنشاء الفيديو.
  • مقياس توجيه الصورة: مقياس توجيه الصورة، المستخدم للتحكم في تأثير إشارات الصورة على إنشاء الفيديو.
  • مقياس التوجيه الصوتي: مقياس التوجيه الصوتي، المستخدم للتحكم في تأثير الإشارات الصوتية على إنشاء الفيديو.
  • خطوات أخذ العينات: عدد خطوات أخذ العينات المستخدمة للتحكم في جودة وتفاصيل الفيديو الناتج.
  • البذرة العشوائية: بذرة عشوائية، تستخدم للتحكم في عشوائية إنشاء الفيديو.

معلومات الاستشهاد

معلومات الاستشهاد لهذا المشروع هي كما يلي:

@misc{chen2025humo,
      title={HuMo: Human-Centric Video Generation via Collaborative Multi-Modal Conditioning}, 
      author={Liyang Chen and Tianxiang Ma and Jiawei Liu and Bingchuan Li and Zhuowei Chen and Lijie Liu and Xu He and Gen Li and Qian He and Zhiyong Wu},
      year={2025},
      eprint={2509.08519},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2509.08519}, 
}

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
HuMo-17B: الإبداع التعاوني ثلاثي الوسائط | الدروس | HyperAI