قاعدة بيانات الكلام الصينية AISHELL-2
التاريخ
رابط النشر
الترخيص
非商业用途
العلامات
تبلغ مدة الكلام في قاعدة بيانات الكلام الصينية الماندرين AISHELL-2 1000 ساعة، منها 718 ساعة من AISHELL-ASR0009-[ZH-CN] و282 ساعة من AISHELL-ASR0010-[ZH-CN]. وتغطي النصوص المسجلة 12 مجالًا بما في ذلك كلمات الاستيقاظ، وكلمات التحكم الصوتي، والمنزل الذكي، والقيادة بدون طيار، والإنتاج الصناعي. تم إجراء عملية التسجيل في بيئة داخلية هادئة، باستخدام ثلاثة أجهزة مختلفة في وقت واحد: ميكروفون عالي الدقة (44.1 كيلو هرتز، 16 بت)؛ هاتف يعمل بنظام أندرويد (16 كيلو هرتز، 16 بت)؛ وهاتف iOS (16 كيلو هرتز، 16 بت). يستخدم AISHELL-2 بيانات صوتية مسجلة بواسطة هواتف iOS. شارك في التسجيل 1991 متحدثًا من مناطق اللهجة المختلفة في الصين. بعد نسخها وتعليقها على يد مصححي الصوت المحترفين واجتياز فحص الجودة الصارم، فإن دقة النص في هذه القاعدة البيانات أعلى من 96%. (دعم البحث الأكاديمي، الاستخدام التجاري ممنوع بدون إذن)