HyperAIHyperAI

Command Palette

Search for a command to run...

Speechocean762: مجموعة بيانات مفتوحة المصدر للكلام الإنجليزي غير الأصيل لتقييم النطق

Junbo Zhang; Zhiwen Zhang; Yongqing Wang; Zhiyong Yan; Qiong Song; Yukai Huang; Ke Li; Daniel Povey; Yujun Wang

الملخص

يقدم هذا البحث مجموعة بيانات صوتية مفتوحة المصدر جديدة باسم "Speechocean762" (مُحيط الكلام 762) مصممة لاستخدامها في تقييم النطق، وتتألف من 5000 جملة إنجليزية نطقها 250 متحدثًا غير أصيل، حيث يشكل الأطفال نصف عدد المتحدثين. قام خمسة خبراء بتصنيف كل جملة على مستوى الجملة والكلمة والفونيم (الصوت). تم إطلاق نظام أساسي مفتوح المصدر لتوضيح عملية تقييم النطق على مستوى الفونيم في هذه المجموعة البيانات. يمكن استخدام هذه المجموعة البيانات بحرية للأغراض التجارية وغير التجارية. وهي متاحة للتنزيل المجاني من OpenSLR، كما تم نشر النظام الأساسي المقابل في أداة Kaldi للاعتراف بالكلام.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
Speechocean762: مجموعة بيانات مفتوحة المصدر للكلام الإنجليزي غير الأصيل لتقييم النطق | مستندات | HyperAI