HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات توليد الصوت غير اللفظي NonverbalTTS

التاريخ

منذ 3 أشهر

الحجم

3.06 GB

رابط الورقة البحثية

arxiv.org

الترخيص

Apache 2.0

*تدعم مجموعة البيانات هذه الاستخدام عبر الإنترنت.انقر هنا للقفز.

NonverbalTTS هي مجموعة بيانات لتوليد الصوت غير اللفظي تم إصدارها بواسطة VK Lab وYandex في عام 2025. نتائج الورقة ذات الصلة هي "NonverbalTTS: مجموعة عامة باللغة الإنجليزية من النطق غير اللفظي المتوافق مع النص مع تعليقات عاطفية لتحويل النص إلى كلام"، والذي يهدف إلى تعزيز البحث في تحويل النص إلى صوت تعبيري (TTS) ودعم النماذج لتوليد كلام طبيعي يحتوي على المشاعر والأصوات غير اللفظية.

تحتوي مجموعة البيانات على 17 ساعة من بيانات الكلام عالية الجودة من 2296 مشاركًا (60% ذكور، 40% إناث)، تغطي 10 أنواع من الكلام غير اللفظي (التنفس، الضحك، التنهد، العطس، السعال، تنظيف الحلق، الأنين، الشخير، والشخير، والاستنشاق) و 8 فئات عاطفية (الغضب، الاشمئزاز، الخوف، السعادة، الحياد، الحزن، المفاجأة، وغيرها).

ميزات مجموعة البيانات:

  • بيانات متعددة المصادر: مستمدة من VoxCeleb و Expresso Corpora
  • البيانات الوصفية الغنية: علامات المشاعر، وتعليقات الكلام غير اللفظية، ومعرفات المتحدث، ومقاييس جودة الصوت
  • معدل أخذ العينات: 16 كيلو هرتز للصوت من VoxCeleb، 48 كيلو هرتز للصوت من Expresso
NonverbalTTS.torrent
البذر 1التنزيل 0مكتمل 23إجمالي التنزيلات 86
  • NonverbalTTS/
    • README.md
      1.77 KB
    • README.txt
      3.55 KB
      • data/
        • NonverbalTTS.zip
          3.06 GB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
مجموعة بيانات توليد الصوت غير اللفظي NonverbalTTS | مجموعات البيانات | HyperAI