مجموعة بيانات تقييم الرسوم المتحركة البشرية المعتمدة على الصوت من Soul-Bench
يُعدّ Soul-Bench معيارًا تقييميًا لمهام الرسوم المتحركة البشرية المعتمدة على الصوت، وقد أصدره مختبر Tencent YouTube Lab في عام 2025. وتشمل الأبحاث ذات الصلة... الروح: بث الحياة في الإنسان الرقمي لإنتاج رسوم متحركة متعددة الوسائط عالية الدقة وطويلة الأمدالهدف هو التقييم المنهجي لجودة التوليد والاتساق وقدرة التعميم للأساليب ذات الصلة في سيناريوهات التطبيق في العالم الحقيقي.
تحتوي مجموعة البيانات هذه على 226 عينة اختبار فيديو، تُظهر توزيعًا غنيًا نسبيًا عبر أبعاد متعددة، كما هو موضح أدناه:
- توزيع أنواع الجسم الرئيسية
- مشاهد الجزء العلوي من الجسم: 107
- مشاهد لكامل الجسم: 72
- صور شخصية، وشخصيات كرتونية، وحيوانات: 47 عنصرًا
- توزيع أنواع الصوت
- الصوت القائم على الحوار: 177 قطعة
- الأداءات الصوتية: 49 عنصرًا
- توزيع دقة الفيديو
- 1080 بكسل: 118 عنصرًا
- 720 بكسل: 55 عنصرًا
- 4K: 51 عنصرًا
- 480 بكسل: عنصران
- نسب الشاشة
- 1 < r ≤ 2: 170 مدخلاً
- نصف القطر = 1 (مربع): 44 سطرًا
- 0.5 ≤ r < 1 (عمودي): 12 سطرًا
- توزيع مدة الفيديو
- الفاصل الزمني من 27 إلى 30 ثانية: 70 سطراً

بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.