HyperAI

قاعدة بيانات الكلام الصينية AISHELL-2

التاريخ

منذ عام واحد

المؤسسة

رابط النشر

www.aishelltech.com

الترخيص

非商业用途

مساعدة التنزيل

تبلغ مدة الكلام في قاعدة بيانات الكلام الصينية الماندرين AISHELL-2 1000 ساعة، منها 718 ساعة من AISHELL-ASR0009-[ZH-CN] و282 ساعة من AISHELL-ASR0010-[ZH-CN]. وتغطي النصوص المسجلة 12 مجالًا بما في ذلك كلمات الاستيقاظ، وكلمات التحكم الصوتي، والمنزل الذكي، والقيادة بدون طيار، والإنتاج الصناعي. تم إجراء عملية التسجيل في بيئة داخلية هادئة، باستخدام ثلاثة أجهزة مختلفة في وقت واحد: ميكروفون عالي الدقة (44.1 كيلو هرتز، 16 بت)؛ هاتف يعمل بنظام أندرويد (16 كيلو هرتز، 16 بت)؛ وهاتف iOS (16 كيلو هرتز، 16 بت). يستخدم AISHELL-2 بيانات صوتية مسجلة بواسطة هواتف iOS. شارك في التسجيل 1991 متحدثًا من مناطق اللهجة المختلفة في الصين. بعد نسخها وتعليقها على يد مصححي الصوت المحترفين واجتياز فحص الجودة الصارم، فإن دقة النص في هذه القاعدة البيانات أعلى من 96%. (دعم البحث الأكاديمي، الاستخدام التجاري ممنوع بدون إذن)