منذ 2 أشهر
نظام التعرف على الكلام الهاتفي المحادثي لشركة آي بي إم لعام 2015
George Saon; Hong-Kwang J. Kuo; Steven Rennie; Michael Picheny

الملخص
نقوم بوصف أحدث التحسينات التي طرأت على نظام التعرف على الكلام الهاتفي التفاعلي باللغة الإنجليزية من شركة IBM. من بين التقنيات التي ثبت فعاليتها هي: شبكات maxout مع معدلات الاندثار المخففة (annealed dropout rates)؛ شبكات تحتوي على عدد كبير جداً من المخرجات تم تدريبها على 2000 ساعة من البيانات؛ نمذجة مشتركة لشبكات العصب المتكررة جزئياً مفككة وشبكات الالتفاف عن طريق دمج طبقات الزجاجة الضيقة (bottleneck) والمخرجات وإعادة تدريب النموذج الناتج؛ وأخيراً، إعادة تقييم نماذج اللغة المعقدة باستخدام نماذج اللغة الأسية والشبكية. أدت هذه التقنيات إلى معدل خطأ الكلمات بنسبة 8.0% في جزء Switchboard من مجموعة اختبار Hub5-2000، وهو ما يمثل تحسيناً نسبياً بنسبة 23% مقارنة بأفضل نتيجة سابقة تم نشرها لدينا.