HyperAIHyperAI

Command Palette

Search for a command to run...

TEVR: تحسين التعرف على الصوت من خلال تقليل التباين في الانتروبيا الخاصة بالـ token

Hajo Nils Krabbenhöft Erhardt Barth

الملخص

يقدم هذا البحث نموذج التعرف على الكلام TEVR، المصمم لتقليل التغير في الانتروبيا الخاصة بالرمز (token entropy) بالنسبة إلى نموذج اللغة. ويستفيد هذا النموذج من حقيقة أنه إذا كان نموذج اللغة قادرًا على التنبؤ بالرمز بشكل موثوق ودقيق على أي حال، فإن النموذج الصوتي لا يحتاج إلى أن يكون دقيقًا في تمييزه. تم تدريب نماذج التعرف على الكلام الألمانية ذات 900 مليون معلمة، وأظهرت النتائج أن نموذج TEVR حقق معدل خطأ كلمة مُحَسَّن جدًا يبلغ 3.64% على مجموعة بيانات CommonVoice الألمانية، ما يفوق أفضل النتائج المبلغ عنها سابقًا بنسبة خفض نسبية في معدل خطأ الكلمة تبلغ 16.89%. ونأمل أن يؤدي إتاحة خط أنابيب التعرف على الكلام المدرب بالكامل للمجتمع إلى تطوير مساعدات افتراضية دون اتصال تُراعي خصوصية المستخدمين في المستقبل.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
TEVR: تحسين التعرف على الصوت من خلال تقليل التباين في الانتروبيا الخاصة بالـ token | مستندات | HyperAI