الملخص

نقدّم مجموعة بيانات جديدة متاحة مجانًا لتمييز الكلام البعيد باللغة الألمانية، ونُقدّم نتائج معدل خطأ الكلمة (WER) المستقلة عن المتكلم لمحرّكَيّ نطق صوتي مفتوح المصدر تم تدريبهما على هذه المجموعة. تم تسجيل المجموعة في بيئة مُحكَمة باستخدام ثلاث ميكروفونات مختلفة على مسافة متر واحد. وتضم المجموعة 180 متحدثًا مختلفًا، وبإجمالي 36 ساعة من التسجيلات الصوتية. ونُظهر نتائج التمييز باستخدام الأداة المفتوحة المصدر Kaldi (معدل خطأ 20.5٪) وPocketSphinx (معدل خطأ 39.6٪)، مما يُمكّن من إتاحة حل مفتوح المصدر كامل لتمييز الكلام البعيد باللغة الألمانية.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار