Command Palette
Search for a command to run...
تينسنت هونيوان فيديو-فولي
التاريخ
الحجم
956.9 MB
الوسوم
رابط الورقة البحثية
1. مقدمة البرنامج التعليمي

HunyuanVideo-Foley هو نموذج متكامل لتوليد الصوت والفيديو، أطلقته شركة Tencent Hunyuan رسميًا كمصدر مفتوح في أغسطس 2025. يهدف هذا النموذج إلى توليد مؤثرات صوتية سينمائية عالية الجودة ومتزامنة تلقائيًا، بما في ذلك الأصوات المحيطة، والمؤثرات الصوتية، والموسيقى الخلفية، وذلك من خلال إدخال لقطات الفيديو والنصوص الوصفية. يتغلب هذا النموذج على قصور مقاطع الفيديو التقليدية المولدة بالذكاء الاصطناعي، والتي غالبًا ما تكون "صامتة"، إذ يمتلك قدرات فهم متعددة الوسائط، ويقوم بتحليل المحتوى المرئي والتعليمات الدلالية في آنٍ واحد، ليُنتج مؤثرات صوتية غامرة "تفهم العناصر المرئية، وتقرأ النصوص، وتُسجل الصوت". يحمل البحث ذو الصلة عنوان "..."HunyuanVideo-Foley: نشر متعدد الوسائط مع محاذاة التمثيل لتوليد صوت فولي عالي الدقة".
يستخدم هذا الشرح وحدة معالجة رسومية واحدة من نوع RTX 4090 لتوفير قوة المعالجة. اللغة الإنجليزية هي اللغة الوحيدة المدعومة حاليًا.
2. أمثلة المشاريع

3. خطوات التشغيل
1. ابدأ تشغيل الحاوية

2. بعد الدخول إلى صفحة الويب، يمكنك استخدام النموذج
إذا ظهرت رسالة "Bad Gateway"، فهذا يعني أن النموذج قيد التهيئة. يُرجى الانتظار من دقيقتين إلى ثلاث دقائق ثم تحديث الصفحة. يُنصح بتحميل فيديو مُشفّر بصيغة H.264 لتسهيل معاينة وتشغيل النتائج المُولّدة على صفحة الويب.

4. المناقشة
🖌️ إذا رأيت مشروعًا عالي الجودة، يُرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، أنشأنا أيضًا مجموعة لتبادل الدروس التعليمية. نرحب بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [دروس SD] للانضمام إلى المجموعة لمناقشة مختلف المشاكل التقنية ومشاركة تأثيرات التطبيق.↓

معلومات الاستشهاد
معلومات الاستشهاد لهذا المشروع هي كما يلي:
@misc{shan2025hunyuanvideofoleymultimodaldiffusionrepresentation,
title={HunyuanVideo-Foley: Multimodal Diffusion with Representation Alignment for High-Fidelity Foley Audio Generation},
author={Sizhe Shan and Qiulin Li and Yutao Cui and Miles Yang and Yuehai Wang and Qun Yang and Jin Zhou and Zhao Zhong},
year={2025},
eprint={2508.16930},
archivePrefix={arXiv},
primaryClass={eess.AS},
url={https://arxiv.org/abs/2508.16930},
}بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.