HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات توليد الصوت غير اللفظي NonverbalTTS

التاريخ

منذ 6 أشهر

الحجم

3.06 GB

رابط الورقة البحثية

arxiv.org

الترخيص

Apache 2.0

NonverbalTTS هي مجموعة بيانات لتوليد الصوت غير اللفظي تم إصدارها بواسطة VK Lab وYandex في عام 2025. نتائج الورقة ذات الصلة هي "NonverbalTTS: مجموعة عامة باللغة الإنجليزية من النطق غير اللفظي المتوافق مع النص مع تعليقات عاطفية لتحويل النص إلى كلام"، والذي يهدف إلى تعزيز البحث في تحويل النص إلى صوت تعبيري (TTS) ودعم النماذج لتوليد كلام طبيعي يحتوي على المشاعر والأصوات غير اللفظية.

تحتوي مجموعة البيانات على 17 ساعة من بيانات الكلام عالية الجودة من 2296 مشاركًا (60% ذكور، 40% إناث)، تغطي 10 أنواع من الكلام غير اللفظي (التنفس، الضحك، التنهد، العطس، السعال، تنظيف الحلق، الأنين، الشخير، والشخير، والاستنشاق) و 8 فئات عاطفية (الغضب، الاشمئزاز، الخوف، السعادة، الحياد، الحزن، المفاجأة، وغيرها).

ميزات مجموعة البيانات:

  • بيانات متعددة المصادر: مستمدة من VoxCeleb و Expresso Corpora
  • البيانات الوصفية الغنية: علامات المشاعر، وتعليقات الكلام غير اللفظية، ومعرفات المتحدث، ومقاييس جودة الصوت
  • معدل أخذ العينات: 16 كيلو هرتز للصوت من VoxCeleb، 48 كيلو هرتز للصوت من Expresso
NonverbalTTS.torrent
البذر 1جارٍ التنزيل 0مكتمل 37إجمالي التنزيلات 133
  • NonverbalTTS/
    • README.md
      1.77 KB
    • README.txt
      3.55 KB
      • data/
        • NonverbalTTS.zip
          3.06 GB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp