HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات معيارية لتوليد فهم الكلام من WildSpeech-Bench

التاريخ

منذ 4 أشهر

الحجم

169.51 MB

المؤسسة

مختبر تينسنت للذكاء الاصطناعي
تينسنت

رابط الورقة البحثية

2506.21875

الترخيص

CC BY 4.0

الوسوم

WildSpeech-Bench هو أول معيار لتقييم قدرات تحويل الكلام إلى كلام في SpeechLLM، والذي أصدرته Tencent في عام 2025. نتائج الورقة البحثية ذات الصلة هي "WildSpeech-Bench: تقييم شامل لبرامج ماجستير الخطابة في البرية"، والذي يهدف إلى قياس قدرة النموذج على فهم وتوليد تحويل الكلام الكامل من مدخل إلى مخرج (كلام إلى كلام، S2S) في سيناريوهات التفاعل الصوتي الحقيقي.

تحتوي مجموعة البيانات على 1100 استعلام موزعة على خمس فئات رئيسية: استعلامات المعلومات، وطلبات الحلول، وتبادل الآراء، وإنشاء النصوص، والتعبيرات شبه الصوتية. تتوافق كل فئة مع نية مستخدم شائعة. 1000 من هذه الاستعلامات مستمدة من سيناريوهات تفاعل صوتي عامة (بما في ذلك استعلامات المعلومات، وطلبات الحلول، وتبادل الآراء، وإنشاء النصوص)، بينما تتميز 100 استعلام أخرى بخصائص شبه صوتية مثل التوقفات، والتجويد، والتلعثم، والتعرف على الكلمات شبه الصوتية. يُرفق بكل استعلام أمثلة متنوعة لمخرجات الكلام، تشمل مجموعة واسعة من سمات المتحدث (الجنس، والعمر، وتنوعات الصوت)، والظروف الصوتية، وإعدادات بيئة الضوضاء، لمحاكاة تنوع وتحديات التفاعل الصوتي الطبيعي بشكل أكثر واقعية.

عملية بناء مجموعة البيانات

WildSpeech-Bench.torrent
البذر 1جارٍ التنزيل 0مكتمل 0إجمالي التنزيلات 67
  • WildSpeech-Bench/
    • README.md
      1.83 KB
    • README.txt
      3.66 KB
      • data/
        • WildSpeech-Bench.zip
          169.51 MB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp