HyperAIHyperAI

Command Palette

Search for a command to run...

الاعتراف بالصوت البعيد الألماني مفتوح المصدر: مجموعة البيانات والنموذج الصوتي

and Chris Biemann Max Mühlhäuser Stefan Radomski Evandro Gouvea Arvid Lange Benjamin Milde Stephan Radeck-Arneth

الملخص

نقدّم مجموعة بيانات جديدة متاحة مجانًا لتمييز الكلام البعيد باللغة الألمانية، ونُقدّم نتائج معدل خطأ الكلمة (WER) المستقلة عن المتكلم لمحرّكَيّ نطق صوتي مفتوح المصدر تم تدريبهما على هذه المجموعة. تم تسجيل المجموعة في بيئة مُحكَمة باستخدام ثلاث ميكروفونات مختلفة على مسافة متر واحد. وتضم المجموعة 180 متحدثًا مختلفًا، وبإجمالي 36 ساعة من التسجيلات الصوتية. ونُظهر نتائج التمييز باستخدام الأداة المفتوحة المصدر Kaldi (معدل خطأ 20.5٪) وPocketSphinx (معدل خطأ 39.6٪)، مما يُمكّن من إتاحة حل مفتوح المصدر كامل لتمييز الكلام البعيد باللغة الألمانية.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp