HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات تقييم الفهم اللغوي الموازي الصوتي StepEval

التاريخ

منذ 2 أشهر

الحجم

440.73 MB

المؤسسة

ستيب فن

رابط الورقة البحثية

2507.16632

الترخيص

Apache 2.0

StepEval Audio Paralinguistic هي مجموعة بيانات لتقييم الفهم الصوتي البارالوجي أصدرها فريق StepFun AI في عام 2025. الورقة ذات الصلة هي "تقرير فني لبرنامج Step-Audio 2"، والذي يهدف إلى تقييم قدرة نماذج الذكاء الاصطناعي على فهم المعلومات اللغوية الموازية (مثل الجنس والعمر ونبرة الصوت والعواطف وما إلى ذلك) في الكلام.

تتكون هذه المجموعة من 550 عينة صوتية، موزعة بالتساوي على 11 بُعدًا للمهام: الجنس، والعمر، وجرس الصوت، والعاطفة، ودرجة الصوت، والإيقاع، والسرعة، وأسلوب التحدث، والنشاط الصوتي، والسيناريو، ونوع الحدث. تستند المهام الثماني الأولى إلى مقاطع صوتية صينية مأخوذة من 400 بودكاست عام، بينما تستخدم المهام الثلاث الأخيرة 50 عينة صوتية من كل من AudioSet (الأحداث)، وCochlScene (المشاهد البيئية)، وVocalSound (المؤثرات الصوتية). جميع العينات لا تتجاوز مدتها 30 ثانية، وتُعاد عيناتها بانتظام إلى 24 كيلوهرتز، ويُعلق عليها فريق متخصص.

StepEval-Audio-Paralinguistic.torrent
البذر 1التنزيل 0مكتمل 11إجمالي التنزيلات 47
  • StepEval-Audio-Paralinguistic/
    • README.md
      1.77 KB
    • README.txt
      3.54 KB
      • data/
        • StepEval-Audio-Paralinguistic.zip
          440.73 MB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp