HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات تقييم توزيع الكلام ShiftySpeech

التاريخ

منذ 3 أيام

المؤسسة

جامعة جونز هوبكنز

الترخيص

Apache 2.0

ShiftySpeech هو معيار واسع النطاق للكشف عن الكلام الاصطناعي، أصدرته جامعة جونز هوبكنز عام ٢٠٢٥. عنوان الورقة البحثية ذات الصلة هو "ShiftySpeech: مجموعة بيانات واسعة النطاق للكلام الاصطناعي مع تحولات التوزيع". تهدف الورقة إلى دراسة قدرة نماذج الكشف عن تركيب الكلام على التعميم في العالم الواقعي عند مواجهة "تحولات التوزيع" (بما في ذلك التغييرات في اللغة، والمتحدث، ونموذج التوليد، وظروف التسجيل).

تحتوي هذه المجموعة من البيانات على أكثر من 3000 ساعة من الكلام المُركّب، تغطي سبعة مجالات مصدرية، بما في ذلك أساليب القراءة، والبودكاست، وتسجيلات يوتيوب، وسيناريوهات أخرى ذات ضوضاء خلفية أو ظروف تسجيل غير قياسية، بالإضافة إلى اختلافات في اللغة، وعمر المتحدث، واللهجة، والجنس. تغطي البيانات ثلاث لغات (الإنجليزية، والصينية، واليابانية)، وقد تم توليد الكلام باستخدام ستة أنظمة تحويل نص إلى كلام (TTS) واثني عشر مُرمِّزًا صوتيًا (مُرمِّزًا صوتيًا/مولدًا للموجات) لبناء درجات مختلفة من انحراف توزيع النظام.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp