منذ 2 أشهر
Speechocean762: مجموعة بيانات مفتوحة المصدر للكلام الإنجليزي غير الأصيل لتقييم النطق
Junbo Zhang; Zhiwen Zhang; Yongqing Wang; Zhiyong Yan; Qiong Song; Yukai Huang; Ke Li; Daniel Povey; Yujun Wang

الملخص
يقدم هذا البحث مجموعة بيانات صوتية مفتوحة المصدر جديدة باسم "Speechocean762" (مُحيط الكلام 762) مصممة لاستخدامها في تقييم النطق، وتتألف من 5000 جملة إنجليزية نطقها 250 متحدثًا غير أصيل، حيث يشكل الأطفال نصف عدد المتحدثين. قام خمسة خبراء بتصنيف كل جملة على مستوى الجملة والكلمة والفونيم (الصوت). تم إطلاق نظام أساسي مفتوح المصدر لتوضيح عملية تقييم النطق على مستوى الفونيم في هذه المجموعة البيانات. يمكن استخدام هذه المجموعة البيانات بحرية للأغراض التجارية وغير التجارية. وهي متاحة للتنزيل المجاني من OpenSLR، كما تم نشر النظام الأساسي المقابل في أداة Kaldi للاعتراف بالكلام.