HyperAIHyperAI

Command Palette

Search for a command to run...

التعرف على الكلام من الطرف إلى الطرف باستخدام MMI خالٍ من الشبكة

Sanjeev Khudanpur Daniel Povey Hossein Sameti Hossein Hadian

الملخص

نقدّم عملنا حول التدريب من الطرف إلى الطرف لنماذج صوتية باستخدام دالة الهدف لـ (LF-MMI) ذات المعلومات المتبادلة العظمى دون استخدام شبكة، في سياق نماذج ماركوف المخفية. بتدريب من الطرف إلى الطرف، نقصد التدريب المسطح لنموذج وحدة شبكة عصبونية عميقة واحدة في مرحلة واحدة، دون استخدام أي نماذج مُدرّبة مسبقًا، أو تطابقات مُجبرة، أو بناء أشجار قرارات مُربوطة بالحالة. نستخدم بيفونات كاملة لتمكين النمذجة المعتمدة على السياق دون الحاجة إلى أشجار، ونُظهر أن نهجنا المُدرّب من الطرف إلى الطرف باستخدام LF-MMI يمكنه تحقيق نتائج مماثلة للنماذج التقليدية LF-MMI في مهام ذات قاموس واسع معروفة. كما نُقارن نتائجنا مع طرق أخرى من الطرف إلى الطرف مثل CTC في بيئات تعتمد على الحروف وبدون قاموس، ونُظهر خفضًا نسبيًا في معدل أخطاء الكلمات يتراوح بين 5% و25% على مهام مختلفة ذات قاموس واسع، مع استخدام نماذج أصغر بشكل كبير.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp