HyperAIHyperAI
منذ 17 أيام

التعرف التلقائي على الكلام باللغة الألمانية: تحليل مفصل للأخطاء

{René Peinl, Johannes Wirth}
التعرف التلقائي على الكلام باللغة الألمانية: تحليل مفصل للأخطاء
الملخص

يزداد بشكل مستمر عدد الأنظمة المتاحة مجانًا للاعتراف التلقائي باللغة الصوتية (ASR) القائمة على الشبكات العصبية، مع تحسن متزايد في دقة التنبؤات الناتجة عنها. ومع ذلك، يعتمد تقييم النماذج المدربة عادةً بشكل حصري على مقاييس إحصائية مثل WER أو CER، التي لا تقدم أي رؤى حول طبيعة الأخطاء أو تأثيرها عند توليد النصوص من المدخلات الصوتية. يقدم هذا العمل مجموعة من هياكل نماذج ASR التي تم تدريبها مسبقًا على اللغة الألمانية، ويُقيّمها على مجموعة معايير متنوعة من مجموعات البيانات الاختبارية. ويُحدد هذا العمل الأخطاء التنبؤية المشتركة بين الهياكل المختلفة، وتصنف هذه الأخطاء إلى فئات، ثم يتتبع أسباب الأخطاء حسب كل فئة إلى بيانات التدريب وأسباب أخرى. وأخيرًا، يناقش حلولًا من أجل إنشاء مجموعات بيانات تدريب ذات جودة أعلى، وتطوير أنظمة ASR أكثر متانة.

التعرف التلقائي على الكلام باللغة الألمانية: تحليل مفصل للأخطاء | أحدث الأوراق البحثية | HyperAI