Command Palette
Search for a command to run...
مجموعة بيانات توليد الصوت غير اللفظي NonverbalTTS
التاريخ
الحجم
رابط الورقة البحثية
الترخيص
Apache 2.0
*تدعم مجموعة البيانات هذه الاستخدام عبر الإنترنت.انقر هنا للقفز.
NonverbalTTS هي مجموعة بيانات لتوليد الصوت غير اللفظي تم إصدارها بواسطة VK Lab وYandex في عام 2025. نتائج الورقة ذات الصلة هي "NonverbalTTS: مجموعة عامة باللغة الإنجليزية من النطق غير اللفظي المتوافق مع النص مع تعليقات عاطفية لتحويل النص إلى كلام"، والذي يهدف إلى تعزيز البحث في تحويل النص إلى صوت تعبيري (TTS) ودعم النماذج لتوليد كلام طبيعي يحتوي على المشاعر والأصوات غير اللفظية.
تحتوي مجموعة البيانات على 17 ساعة من بيانات الكلام عالية الجودة من 2296 مشاركًا (60% ذكور، 40% إناث)، تغطي 10 أنواع من الكلام غير اللفظي (التنفس، الضحك، التنهد، العطس، السعال، تنظيف الحلق، الأنين، الشخير، والشخير، والاستنشاق) و 8 فئات عاطفية (الغضب، الاشمئزاز، الخوف، السعادة، الحياد، الحزن، المفاجأة، وغيرها).
ميزات مجموعة البيانات:
- بيانات متعددة المصادر: مستمدة من VoxCeleb و Expresso Corpora
- البيانات الوصفية الغنية: علامات المشاعر، وتعليقات الكلام غير اللفظية، ومعرفات المتحدث، ومقاييس جودة الصوت
- معدل أخذ العينات: 16 كيلو هرتز للصوت من VoxCeleb، 48 كيلو هرتز للصوت من Expresso
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.