منذ 17 أيام
الاعتراف بالصوت البعيد الألماني مفتوح المصدر: مجموعة البيانات والنموذج الصوتي
{and Chris Biemann, Max Mühlhäuser, Stefan Radomski, Evandro Gouvea, Arvid Lange, Benjamin Milde, Stephan Radeck-Arneth}

الملخص
نقدّم مجموعة بيانات جديدة متاحة مجانًا لتمييز الكلام البعيد باللغة الألمانية، ونُقدّم نتائج معدل خطأ الكلمة (WER) المستقلة عن المتكلم لمحرّكَيّ نطق صوتي مفتوح المصدر تم تدريبهما على هذه المجموعة. تم تسجيل المجموعة في بيئة مُحكَمة باستخدام ثلاث ميكروفونات مختلفة على مسافة متر واحد. وتضم المجموعة 180 متحدثًا مختلفًا، وبإجمالي 36 ساعة من التسجيلات الصوتية. ونُظهر نتائج التمييز باستخدام الأداة المفتوحة المصدر Kaldi (معدل خطأ 20.5٪) وPocketSphinx (معدل خطأ 39.6٪)، مما يُمكّن من إتاحة حل مفتوح المصدر كامل لتمييز الكلام البعيد باللغة الألمانية.