HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات تقييم توزيع الكلام ShiftySpeech

التاريخ

منذ 3 أشهر

الحجم

389.35 GB

المؤسسة

جامعة جونز هوبكنز

رابط الورقة البحثية

2502.05674

الترخيص

Apache 2.0

ShiftySpeech هو معيار واسع النطاق للكشف عن الكلام الاصطناعي أصدرته جامعة جونز هوبكنز في عام 2025. عنوان الورقة البحثية ذات الصلة هو "ShiftySpeech: مجموعة بيانات كلامية اصطناعية واسعة النطاق مع تحولات التوزيعالهدف هو دراسة قدرة التعميم لنماذج اكتشاف تركيب الكلام في العالم الحقيقي عند مواجهة "انحراف التوزيع" (بما في ذلك التغييرات في اللغة والمتحدث ونموذج التوليد وظروف التسجيل).

تحتوي هذه المجموعة من البيانات على أكثر من 3000 ساعة من الكلام المُركّب، تغطي سبعة مجالات مصدرية، بما في ذلك أساليب القراءة، والبودكاست، وتسجيلات يوتيوب، وسيناريوهات أخرى ذات ضوضاء خلفية أو ظروف تسجيل غير قياسية، بالإضافة إلى اختلافات في اللغة، وعمر المتحدث، واللهجة، والجنس. تغطي البيانات ثلاث لغات (الإنجليزية، والصينية، واليابانية)، وقد تم توليد الكلام باستخدام ستة أنظمة تحويل نص إلى كلام (TTS) واثني عشر مُرمِّزًا صوتيًا (مُرمِّزًا صوتيًا/مولدًا للموجات) لبناء درجات مختلفة من انحراف توزيع النظام.

ShiftySpeech.torrent
البذر 1جارٍ التنزيل 0مكتمل 1إجمالي التنزيلات 66
  • ShiftySpeech/
    • README.md
      1.6 KB
    • README.txt
      3.2 KB
      • data/
        • ShiftySpeech.zip
          389.35 GB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp