HyperAIHyperAI
منذ 2 أشهر

نظام التعرف على الكلام الهاتفي المحادثي لشركة آي بي إم لعام 2015

George Saon; Hong-Kwang J. Kuo; Steven Rennie; Michael Picheny
نظام التعرف على الكلام الهاتفي المحادثي لشركة آي بي إم لعام 2015
الملخص

نقوم بوصف أحدث التحسينات التي طرأت على نظام التعرف على الكلام الهاتفي التفاعلي باللغة الإنجليزية من شركة IBM. من بين التقنيات التي ثبت فعاليتها هي: شبكات maxout مع معدلات الاندثار المخففة (annealed dropout rates)؛ شبكات تحتوي على عدد كبير جداً من المخرجات تم تدريبها على 2000 ساعة من البيانات؛ نمذجة مشتركة لشبكات العصب المتكررة جزئياً مفككة وشبكات الالتفاف عن طريق دمج طبقات الزجاجة الضيقة (bottleneck) والمخرجات وإعادة تدريب النموذج الناتج؛ وأخيراً، إعادة تقييم نماذج اللغة المعقدة باستخدام نماذج اللغة الأسية والشبكية. أدت هذه التقنيات إلى معدل خطأ الكلمات بنسبة 8.0% في جزء Switchboard من مجموعة اختبار Hub5-2000، وهو ما يمثل تحسيناً نسبياً بنسبة 23% مقارنة بأفضل نتيجة سابقة تم نشرها لدينا.

نظام التعرف على الكلام الهاتفي المحادثي لشركة آي بي إم لعام 2015 | أحدث الأوراق البحثية | HyperAI