منذ 3 أيام

الملخص

يُعدّ دوبلاج الأفلام مهمةً تركيبية للصوت من نصوص مكتوبة، مُشترطةً بمشاهد الفيديو، وتتطلب تزامنًا دقيقًا للشفاه، ونقلًا أمينًا للنبرة الصوتية، بالإضافة إلى نمذجة سليمة لهوية الشخصيات ومشاعرها. غير أن الأساليب القائمة تواجه قيودًا رئيسية اثنتين: (1) محدودية نطاق مجموعات البيانات متعددة الوسائط عالية الجودة للدوبلاج، والتي تعاني من معدلات خطأ عالية في التعرف على الكلام، وتفتقر إلى إشارات توضيحية (annotations) شاملة، وتعتمد على وضع العلامات يدويًا بتكلفة باهظة، كما أنها تقتصر على مشاهد الأحاديث المنفردة، مما يعيق التدريب الفعال للنماذج؛ (2) اعتماد نماذج الدوبلاج الحالية حصريًا على منطقة الشفاه لتعلم التوافق بين الصوت والصورة، مما يحدّ من قابليتها للتطبيق في مشاهد سينمائية حية معقدة، ويُظهر أداءً دون المستوى الأمثل في تزامن الشفاه، وجودة الصوت، والتعبير العاطفي.لمعالجة هذه التحديات، نقترح FunCineForge، وهو يتألف من خط إنتاج متكامل (end-to-end production pipeline) لبناء مجموعات بيانات دوبلاج واسعة النطاق، ونموذج دوبلاج قائم على MLLM مصمم خصيصًا لمختلف المشاهد السينمائية. باستخدام هذا الخط الإنتاجي، قمنا ببناء أول مجموعة بيانات للدوبلاج في المسلسلات التلفزيونية الصينية، مزوّدة بإشارات توضيحية غنية، وأثبتنا جودة هذه البيانات العالية. وتُظهر التجارب التي شملت مشاهد الأحاديث المنفردة، والسرد، والحوار، والسيناريوهات متعددة المتحدثين، أن نموذج الدوبلاج المقترح يتفوق بشكل ثابت على أحدث الأساليب (SOTA) من حيث جودة الصوت، وتزامن الشفاه، ونقل النبرة الصوتية، والالتزام بالتعليمات (instruction following).

ملف PDF المصدر عرض الكود

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Jiaxuan Liu Yang Xiang Han Zhao Xiangang Li Zhenhua Ling

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Jiaxuan Liu Yang Xiang Han Zhao Xiangang Li Zhenhua Ling

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Jiaxuan Liu Yang Xiang Han Zhao Xiangang Li Zhenhua Ling

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

FunCineForge: مجموعة أدوات بيانات موحدة ونموذج للترجمة الصوتية للأفلام دون أمثلة في مشاهد سينمائية متنوعة

Jiaxuan Liu Yang Xiang Han Zhao Xiangang Li Zhenhua Ling

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

FunCineForge: مجموعة أدوات بيانات موحدة ونموذج للترجمة الصوتية للأفلام دون أمثلة في مشاهد سينمائية متنوعة

Jiaxuan Liu Yang Xiang Han Zhao Xiangang Li Zhenhua Ling

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

FunCineForge: مجموعة أدوات بيانات موحدة ونموذج للترجمة الصوتية للأفلام دون أمثلة في مشاهد سينمائية متنوعة

Jiaxuan Liu Yang Xiang Han Zhao Xiangang Li Zhenhua Ling

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters