HyperAIHyperAI
منذ 17 أيام

التعرف على الكلام من الطرف إلى الطرف باستخدام MMI خالٍ من الشبكة

{Sanjeev Khudanpur, Daniel Povey, Hossein Sameti, Hossein Hadian}
التعرف على الكلام من الطرف إلى الطرف باستخدام MMI خالٍ من الشبكة
الملخص

نقدّم عملنا حول التدريب من الطرف إلى الطرف لنماذج صوتية باستخدام دالة الهدف لـ (LF-MMI) ذات المعلومات المتبادلة العظمى دون استخدام شبكة، في سياق نماذج ماركوف المخفية. بتدريب من الطرف إلى الطرف، نقصد التدريب المسطح لنموذج وحدة شبكة عصبونية عميقة واحدة في مرحلة واحدة، دون استخدام أي نماذج مُدرّبة مسبقًا، أو تطابقات مُجبرة، أو بناء أشجار قرارات مُربوطة بالحالة. نستخدم بيفونات كاملة لتمكين النمذجة المعتمدة على السياق دون الحاجة إلى أشجار، ونُظهر أن نهجنا المُدرّب من الطرف إلى الطرف باستخدام LF-MMI يمكنه تحقيق نتائج مماثلة للنماذج التقليدية LF-MMI في مهام ذات قاموس واسع معروفة. كما نُقارن نتائجنا مع طرق أخرى من الطرف إلى الطرف مثل CTC في بيئات تعتمد على الحروف وبدون قاموس، ونُظهر خفضًا نسبيًا في معدل أخطاء الكلمات يتراوح بين 5% و25% على مهام مختلفة ذات قاموس واسع، مع استخدام نماذج أصغر بشكل كبير.

التعرف على الكلام من الطرف إلى الطرف باستخدام MMI خالٍ من الشبكة | أحدث الأوراق البحثية | HyperAI