HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات توليد الصوت غير اللفظي NonverbalTTS

Date

منذ 5 أشهر

Size

3.06 GB

Paper URL

arxiv.org

License

Apache 2.0

NonverbalTTS هي مجموعة بيانات لتوليد الصوت غير اللفظي تم إصدارها بواسطة VK Lab وYandex في عام 2025. نتائج الورقة ذات الصلة هي "NonverbalTTS: مجموعة عامة باللغة الإنجليزية من النطق غير اللفظي المتوافق مع النص مع تعليقات عاطفية لتحويل النص إلى كلام"، والذي يهدف إلى تعزيز البحث في تحويل النص إلى صوت تعبيري (TTS) ودعم النماذج لتوليد كلام طبيعي يحتوي على المشاعر والأصوات غير اللفظية.

تحتوي مجموعة البيانات على 17 ساعة من بيانات الكلام عالية الجودة من 2296 مشاركًا (60% ذكور، 40% إناث)، تغطي 10 أنواع من الكلام غير اللفظي (التنفس، الضحك، التنهد، العطس، السعال، تنظيف الحلق، الأنين، الشخير، والشخير، والاستنشاق) و 8 فئات عاطفية (الغضب، الاشمئزاز، الخوف، السعادة، الحياد، الحزن، المفاجأة، وغيرها).

ميزات مجموعة البيانات:

  • بيانات متعددة المصادر: مستمدة من VoxCeleb و Expresso Corpora
  • البيانات الوصفية الغنية: علامات المشاعر، وتعليقات الكلام غير اللفظية، ومعرفات المتحدث، ومقاييس جودة الصوت
  • معدل أخذ العينات: 16 كيلو هرتز للصوت من VoxCeleb، 48 كيلو هرتز للصوت من Expresso
NonverbalTTS.torrent
Seeding 1Downloading 0Completed 28Total Downloads 124
  • NonverbalTTS/
    • README.md
      1.77 KB
    • README.txt
      3.55 KB
      • data/
        • NonverbalTTS.zip
          3.06 GB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp