قاعدة بيانات AISHELL-1 مفتوحة المصدر للكلام الصيني
التاريخ
الحجم
رابط النشر
العلامات
تتمتع قاعدة بيانات الكلام الصينية الماندرينية مفتوحة المصدر Hillshell AISHELL-ASR0009-OS1 بوقت تسجيل يصل إلى 178 ساعة وهي جزء من قاعدة بيانات الكلام الصينية الماندرينية Hillshell AISHELL-ASR0009.
يغطي نص التسجيل AISHELL-ASR0009 11 مجالًا بما في ذلك المنزل الذكي والقيادة بدون طيار والإنتاج الصناعي وما إلى ذلك. تم إجراء عملية التسجيل في بيئة داخلية هادئة، باستخدام ثلاثة أجهزة مختلفة في وقت واحد: ميكروفون عالي الدقة (44.1 كيلو هرتز، 16 بت)؛ هاتف يعمل بنظام أندرويد (16 كيلو هرتز، 16 بت)؛ وهاتف iOS (16 كيلو هرتز، 16 بت). تم تقليص حجم الصوت المسجل بميكروفون عالي الدقة إلى 16 كيلو هرتز لجهاز AISHELL-ASR0009-OS1. تم إجراء التسجيل بواسطة 400 متحدث من مناطق مختلفة من الصين. بعد أن تم نسخها وتعليقها بواسطة مصححي الصوت المحترفين واجتياز فحص الجودة الصارم، فإن دقة النص في هذه القاعدة البيانات أعلى من 95%. يتم تقسيمها إلى مجموعة التدريب ومجموعة التطوير ومجموعة الاختبار.