Command Palette
Search for a command to run...
مجموعة بيانات تقييم توزيع الكلام ShiftySpeech
Date
Size
Paper URL
License
Apache 2.0
ShiftySpeech هو معيار واسع النطاق للكشف عن الكلام الاصطناعي أصدرته جامعة جونز هوبكنز في عام 2025. عنوان الورقة البحثية ذات الصلة هو "ShiftySpeech: مجموعة بيانات كلامية اصطناعية واسعة النطاق مع تحولات التوزيعالهدف هو دراسة قدرة التعميم لنماذج اكتشاف تركيب الكلام في العالم الحقيقي عند مواجهة "انحراف التوزيع" (بما في ذلك التغييرات في اللغة والمتحدث ونموذج التوليد وظروف التسجيل).
تحتوي هذه المجموعة من البيانات على أكثر من 3000 ساعة من الكلام المُركّب، تغطي سبعة مجالات مصدرية، بما في ذلك أساليب القراءة، والبودكاست، وتسجيلات يوتيوب، وسيناريوهات أخرى ذات ضوضاء خلفية أو ظروف تسجيل غير قياسية، بالإضافة إلى اختلافات في اللغة، وعمر المتحدث، واللهجة، والجنس. تغطي البيانات ثلاث لغات (الإنجليزية، والصينية، واليابانية)، وقد تم توليد الكلام باستخدام ستة أنظمة تحويل نص إلى كلام (TTS) واثني عشر مُرمِّزًا صوتيًا (مُرمِّزًا صوتيًا/مولدًا للموجات) لبناء درجات مختلفة من انحراف توزيع النظام.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.