@misc{soul, title={Soul: Breathe Life into Digital Human for High-fidelity Long-term Multimodal Animation}, author={Jiangning Zhang and Junwei Zhu and Zhenye Gan and Donghao Luo and Chuming Lin and Feifan Xu and Xu Peng and Jianlong Hu and Yuansen Liu and Yijia Hong and Weijian Cao and Han Feng and Xu Chen and Chencan Fu and Keke He and Xiaobin Hu and Chengjie Wang}, year={2025}, eprint={2512.13495}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2512.13495}, }

استخدم مجموعة البيانات هذه ناقش على Discord

التاريخ

منذ 6 أشهر

المؤسسة

رابط الورقة البحثية

2512.13495

الترخيص

Non-Commercial

الوسوم

توليد الفيديو

التعرف على الصوت

يُعدّ Soul-Bench معيارًا تقييميًا لمهام الرسوم المتحركة البشرية المعتمدة على الصوت، وقد أصدره مختبر Tencent YouTube Lab في عام 2025. وتشمل الأبحاث ذات الصلة... الروح: بث الحياة في الإنسان الرقمي لإنتاج رسوم متحركة متعددة الوسائط عالية الدقة وطويلة الأمدالهدف هو التقييم المنهجي لجودة التوليد والاتساق وقدرة التعميم للأساليب ذات الصلة في سيناريوهات التطبيق في العالم الحقيقي. تحتوي مجموعة البيانات هذه على 226 عينة اختبار فيديو، تُظهر توزيعًا غنيًا نسبيًا عبر أبعاد متعددة، كما هو موضح أدناه:

توزيع أنواع الجسم الرئيسية

مشاهد الجزء العلوي من الجسم: 107
مشاهد لكامل الجسم: 72
صور شخصية، وشخصيات كرتونية، وحيوانات: 47 عنصرًا

توزيع أنواع الصوت

الصوت القائم على الحوار: 177 قطعة
الأداءات الصوتية: 49 عنصرًا

توزيع دقة الفيديو

1080 بكسل: 118 عنصرًا
720 بكسل: 55 عنصرًا
4K: 51 عنصرًا
480 بكسل: عنصران

نسب الشاشة

1 < r ≤ 2: 170 مدخلاً
نصف القطر = 1 (مربع): 44 سطرًا
0.5 ≤ r < 1 (عمودي): 12 سطرًا

توزيع مدة الفيديو

الفاصل الزمني من 27 إلى 30 ثانية: 70 سطراً
مثال لمجموعة البيانات

الاستشهاد

@misc{soul,
title={Soul: Breathe Life into Digital Human for High-fidelity Long-term Multimodal Animation},
author={Jiangning Zhang and Junwei Zhu and Zhenye Gan and Donghao Luo and Chuming Lin and Feifan Xu and Xu Peng and Jianlong Hu and Yuansen Liu and Yijia Hong and Weijian Cao and Han Feng and Xu Chen and Chencan Fu and Keke He and Xiaobin Hu and Chengjie Wang},
year={2025},
eprint={2512.13495},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2512.13495},
}

تم المساهمة بهذه المجموعة من البيانات من قبل مستخدمي المجتمع وهي مخصصة للأغراض التعليمية والإعلامية فقط. إذا كان أي محتوى ينطوي على انتهاك لحقوق النشر، يرجى الاتصال بنا على [email protected] للمراجعة والإزالة الفورية.

مجموعات البيانات ذات الصلة

مجموعة بيانات مرجعية لفهم تغيرات المناطق عن بعد من مركز أبحاث الاستشعار عن بعد (RSRCC)

منذ يوم واحد

مجموعة بيانات تقييم المباني المتضررة من الكوارث BRIGHT

منذ يوم واحد

مجموعة بيانات تقييم قدرة تحليل الوسائط المتعددة OmniParsingBench

منذ يوم واحد

مجموعة بيانات نموذج العالم

منذ 2 أشهر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

HyperAI

استخدم مجموعة البيانات هذه ناقش على Discord

التاريخ

منذ 6 أشهر

المؤسسة

رابط الورقة البحثية

2512.13495

الترخيص

Non-Commercial

الوسوم

توليد الفيديو

التعرف على الصوت

توزيع أنواع الجسم الرئيسية

مشاهد الجزء العلوي من الجسم: 107
مشاهد لكامل الجسم: 72
صور شخصية، وشخصيات كرتونية، وحيوانات: 47 عنصرًا

توزيع أنواع الصوت

الصوت القائم على الحوار: 177 قطعة
الأداءات الصوتية: 49 عنصرًا

توزيع دقة الفيديو

1080 بكسل: 118 عنصرًا
720 بكسل: 55 عنصرًا
4K: 51 عنصرًا
480 بكسل: عنصران

نسب الشاشة

1 < r ≤ 2: 170 مدخلاً
نصف القطر = 1 (مربع): 44 سطرًا
0.5 ≤ r < 1 (عمودي): 12 سطرًا

توزيع مدة الفيديو

الفاصل الزمني من 27 إلى 30 ثانية: 70 سطراً
مثال لمجموعة البيانات

الاستشهاد

@misc{soul,
title={Soul: Breathe Life into Digital Human for High-fidelity Long-term Multimodal Animation},
author={Jiangning Zhang and Junwei Zhu and Zhenye Gan and Donghao Luo and Chuming Lin and Feifan Xu and Xu Peng and Jianlong Hu and Yuansen Liu and Yijia Hong and Weijian Cao and Han Feng and Xu Chen and Chencan Fu and Keke He and Xiaobin Hu and Chengjie Wang},
year={2025},
eprint={2512.13495},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2512.13495},
}

مجموعات البيانات ذات الصلة

مجموعة بيانات تقييم المعرفة الثقافية متعددة اللغات MAKIEVAL

منذ 2 ساعات

استعلام عن نطاقات حرفية، شرط الاستعلام، استخراج الأدلة، مجموعة البيانات

بعد 5 ساعات

مجموعة بيانات تقييم الذاكرة طويلة المدى RHELM

منذ 21 ساعات

مجموعة بيانات إعادة بناء الكائنات ثلاثية الأبعاد للفنانين SAM 3D

بعد 2 ساعات

مجموعة بيانات الاستدلال الرياضي SFT Nemotron-SFT-Math-v4

منذ 2 ساعات

فهم مخطط ChartNet لمجموعة البيانات متعددة الوسائط

منذ 18 أيام

مجموعة بيانات SMOL للترجمة المتوازية متعددة اللغات

منذ 19 أيام

مجموعة بيانات تقييم معايير الوكلاء الأذكياء الطبيين chi-bench

منذ 6 أيام

مجموعة بيانات MemLens المعيارية متعددة الوسائط ذات السياق الطويل

منذ 19 أيام

مجموعة بيانات MathNet متعددة الوسائط للاستدلال الرياضي المعياري

منذ شهر واحد

مجموعة بيانات Claw-Eval المعيارية في العالم الحقيقي

منذ شهر واحد

مجموعة بيانات تصنيف أمراض قاع العين

منذ شهر واحد

مجموعة بيانات مرجعية لفهم تغيرات المناطق عن بعد من مركز أبحاث الاستشعار عن بعد (RSRCC)

منذ يوم واحد

مجموعة بيانات تقييم المباني المتضررة من الكوارث BRIGHT

منذ يوم واحد

مجموعة بيانات تقييم قدرة تحليل الوسائط المتعددة OmniParsingBench

منذ يوم واحد

مجموعة بيانات نموذج العالم

منذ 2 أشهر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

Command Palette

مجموعة بيانات تقييم الرسوم المتحركة البشرية المعتمدة على الصوت من Soul-Bench

الاستشهاد

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

مجموعة بيانات تقييم الرسوم المتحركة البشرية المعتمدة على الصوت من Soul-Bench

الاستشهاد

مجموعات البيانات ذات الصلة

مجموعة بيانات تقييم المعرفة الثقافية متعددة اللغات MAKIEVAL

استعلام عن نطاقات حرفية، شرط الاستعلام، استخراج الأدلة، مجموعة البيانات

مجموعة بيانات تقييم الذاكرة طويلة المدى RHELM

مجموعة بيانات إعادة بناء الكائنات ثلاثية الأبعاد للفنانين SAM 3D

مجموعة بيانات الاستدلال الرياضي SFT Nemotron-SFT-Math-v4

فهم مخطط ChartNet لمجموعة البيانات متعددة الوسائط

مجموعة بيانات SMOL للترجمة المتوازية متعددة اللغات

مجموعة بيانات تقييم معايير الوكلاء الأذكياء الطبيين chi-bench

مجموعة بيانات MemLens المعيارية متعددة الوسائط ذات السياق الطويل

مجموعة بيانات MathNet متعددة الوسائط للاستدلال الرياضي المعياري

مجموعة بيانات Claw-Eval المعيارية في العالم الحقيقي

مجموعة بيانات تصنيف أمراض قاع العين

مجموعة بيانات مرجعية لفهم تغيرات المناطق عن بعد من مركز أبحاث الاستشعار عن بعد (RSRCC)

مجموعة بيانات تقييم المباني المتضررة من الكوارث BRIGHT

مجموعة بيانات تقييم قدرة تحليل الوسائط المتعددة OmniParsingBench

مجموعة بيانات نموذج العالم

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

مجموعة بيانات تقييم الرسوم المتحركة البشرية المعتمدة على الصوت من Soul-Bench

الاستشهاد

مجموعات البيانات ذات الصلة

مجموعة بيانات تقييم المعرفة الثقافية متعددة اللغات MAKIEVAL

استعلام عن نطاقات حرفية، شرط الاستعلام، استخراج الأدلة، مجموعة البيانات

مجموعة بيانات تقييم الذاكرة طويلة المدى RHELM

مجموعة بيانات إعادة بناء الكائنات ثلاثية الأبعاد للفنانين SAM 3D

مجموعة بيانات الاستدلال الرياضي SFT Nemotron-SFT-Math-v4

فهم مخطط ChartNet لمجموعة البيانات متعددة الوسائط

مجموعة بيانات SMOL للترجمة المتوازية متعددة اللغات

مجموعة بيانات تقييم معايير الوكلاء الأذكياء الطبيين chi-bench

مجموعة بيانات MemLens المعيارية متعددة الوسائط ذات السياق الطويل

مجموعة بيانات MathNet متعددة الوسائط للاستدلال الرياضي المعياري

مجموعة بيانات Claw-Eval المعيارية في العالم الحقيقي

مجموعة بيانات تصنيف أمراض قاع العين

مجموعة بيانات مرجعية لفهم تغيرات المناطق عن بعد من مركز أبحاث الاستشعار عن بعد (RSRCC)

مجموعة بيانات تقييم المباني المتضررة من الكوارث BRIGHT

مجموعة بيانات تقييم قدرة تحليل الوسائط المتعددة OmniParsingBench

مجموعة بيانات نموذج العالم

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

مجموعات البيانات ذات الصلة

مجموعة بيانات تقييم المعرفة الثقافية متعددة اللغات MAKIEVAL

استعلام عن نطاقات حرفية، شرط الاستعلام، استخراج الأدلة، مجموعة البيانات

مجموعة بيانات تقييم الذاكرة طويلة المدى RHELM

مجموعة بيانات إعادة بناء الكائنات ثلاثية الأبعاد للفنانين SAM 3D

مجموعة بيانات الاستدلال الرياضي SFT Nemotron-SFT-Math-v4

فهم مخطط ChartNet لمجموعة البيانات متعددة الوسائط

مجموعة بيانات SMOL للترجمة المتوازية متعددة اللغات

مجموعة بيانات تقييم معايير الوكلاء الأذكياء الطبيين chi-bench

مجموعة بيانات MemLens المعيارية متعددة الوسائط ذات السياق الطويل

مجموعة بيانات MathNet متعددة الوسائط للاستدلال الرياضي المعياري

مجموعة بيانات Claw-Eval المعيارية في العالم الحقيقي

مجموعة بيانات تصنيف أمراض قاع العين

مجموعة بيانات مرجعية لفهم تغيرات المناطق عن بعد من مركز أبحاث الاستشعار عن بعد (RSRCC)

مجموعة بيانات تقييم المباني المتضررة من الكوارث BRIGHT

مجموعة بيانات تقييم قدرة تحليل الوسائط المتعددة OmniParsingBench

مجموعة بيانات نموذج العالم

مجموعات البيانات ذات الصلة

مجموعة بيانات تقييم المعرفة الثقافية متعددة اللغات MAKIEVAL

استعلام عن نطاقات حرفية، شرط الاستعلام، استخراج الأدلة، مجموعة البيانات

مجموعة بيانات تقييم الذاكرة طويلة المدى RHELM

مجموعة بيانات إعادة بناء الكائنات ثلاثية الأبعاد للفنانين SAM 3D

مجموعة بيانات الاستدلال الرياضي SFT Nemotron-SFT-Math-v4

فهم مخطط ChartNet لمجموعة البيانات متعددة الوسائط

مجموعة بيانات SMOL للترجمة المتوازية متعددة اللغات

مجموعة بيانات تقييم معايير الوكلاء الأذكياء الطبيين chi-bench

مجموعة بيانات MemLens المعيارية متعددة الوسائط ذات السياق الطويل

مجموعة بيانات MathNet متعددة الوسائط للاستدلال الرياضي المعياري

مجموعة بيانات Claw-Eval المعيارية في العالم الحقيقي

مجموعة بيانات تصنيف أمراض قاع العين

مجموعة بيانات مرجعية لفهم تغيرات المناطق عن بعد من مركز أبحاث الاستشعار عن بعد (RSRCC)