HyperAIHyperAI

Command Palette

Search for a command to run...

Console

مجموعة بيانات معيارية لتوليد فهم الكلام من WildSpeech-Bench

Date

منذ 2 أشهر

Size

169.51 MB

Organization

مختبر تينسنت للذكاء الاصطناعي
تينسنت

Paper URL

2506.21875

License

CC BY 4.0

WildSpeech-Bench هو أول معيار لتقييم قدرات تحويل الكلام إلى كلام في SpeechLLM، والذي أصدرته Tencent في عام 2025. نتائج الورقة البحثية ذات الصلة هي "WildSpeech-Bench: تقييم شامل لبرامج ماجستير الخطابة في البرية"، والذي يهدف إلى قياس قدرة النموذج على فهم وتوليد تحويل الكلام الكامل من مدخل إلى مخرج (كلام إلى كلام، S2S) في سيناريوهات التفاعل الصوتي الحقيقي.

تحتوي مجموعة البيانات على 1100 استعلام موزعة على خمس فئات رئيسية: استعلامات المعلومات، وطلبات الحلول، وتبادل الآراء، وإنشاء النصوص، والتعبيرات شبه الصوتية. تتوافق كل فئة مع نية مستخدم شائعة. 1000 من هذه الاستعلامات مستمدة من سيناريوهات تفاعل صوتي عامة (بما في ذلك استعلامات المعلومات، وطلبات الحلول، وتبادل الآراء، وإنشاء النصوص)، بينما تتميز 100 استعلام أخرى بخصائص شبه صوتية مثل التوقفات، والتجويد، والتلعثم، والتعرف على الكلمات شبه الصوتية. يُرفق بكل استعلام أمثلة متنوعة لمخرجات الكلام، تشمل مجموعة واسعة من سمات المتحدث (الجنس، والعمر، وتنوعات الصوت)، والظروف الصوتية، وإعدادات بيئة الضوضاء، لمحاكاة تنوع وتحديات التفاعل الصوتي الطبيعي بشكل أكثر واقعية.

عملية بناء مجموعة البيانات

WildSpeech-Bench.torrent
Seeding 1Downloading 0Completed 0Total Downloads 20
  • WildSpeech-Bench/
    • README.md
      1.83 KB
    • README.txt
      3.66 KB
      • data/
        • WildSpeech-Bench.zip
          169.51 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp