HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات الكلام عالية النطاق الترددي واسعة النطاق HiFiTTS-2

Discuss on Discord

Date

منذ 4 أشهر

Organization

إنفيديا

Paper URL

2506.04152

License

CC BY 4.0

HiFiTTS-2 هي مجموعة بيانات كلامية واسعة النطاق وعالية النطاق الترددي أصدرتها NVIDIA في عام 2025. نتائج الورقة ذات الصلة هي "HiFiTTS-2: مجموعة بيانات كلامية واسعة النطاق وعالية النطاق الترددي"، تم تصميمه لدعم تدريب وتقييم نماذج تحويل النص إلى كلام (TTS) عالية الجودة.

تحتوي هذه المجموعة من البيانات على بيانات وصفية صوتية من 5000 متحدث، أي ما يقارب 36700 ساعة من تسجيلات الكلام الإنجليزية بتردد 22.05 كيلوهرتز و31700 ساعة بتردد 44.1 كيلوهرتز، مُرتبة حسب جودة النطاق الترددي ومعدل أخذ العينات. مصدر البيانات هو كتب LibriVox الصوتية، المتوفرة للتنزيل من LibriVox، ويتم أخذ عينات منها بتردد 48 كيلوهرتز، مما يجعلها مناسبة لتدريب مُرمِّزات الصوت عالية الدقة ونماذج توليف الكلام غير الانحداري التلقائي.

تتضمن البيانات ما يلي:

  • الصوت الصوتي (22 كيلو هرتز / 44 كيلو هرتز، أحادي)
  • نص وبيانات وصفية للفصول/الحلقات
  • تقدير جودة مكبر الصوت وعرض النطاق الترددي، وختم زمني للتجزئة
  • بيانات التدريب/التحقق وتكوينات الأمثلة

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp