HyperAIHyperAI
منذ 17 أيام

التعرف على الكلام شبه المُراقب من خلال مطابقة الأولويات المحلية

Wei-Ning Hsu, Ann Lee, Gabriel Synnaeve, Awni Hannun
التعرف على الكلام شبه المُراقب من خلال مطابقة الأولويات المحلية
الملخص

بالنسبة لمهام التحويل التسلسلي مثل التعرف على الصوت، يُشغّل نموذج أولي منظم قوي معلومات غنية حول الفضاء المستهدف، ويستبعد تلقائيًا التسلسلات غير الصالحة من خلال تعيين احتمال منخفض لها. في هذه الدراسة، نقترح "مطابقة الأولي المحلية" (LPM)، وهي هدف شبه مُعلَّم يُستمد من خلال نقل المعرفة من نموذج أولي قوي (مثل نموذج لغوي) إلى نموذج تمييزي يُدرَّب على بيانات صوتية غير مُعلَّمة. نُظهر أن LPM مدعومة نظريًا، وسهلة التنفيذ، وتفوق التقنيات الحالية لنقل المعرفة في ظل ظروف مماثلة. بدءًا من نموذج أساسي مدرَّب على 100 ساعة من البيانات المُعلَّمة، مع إضافة 360 ساعة من البيانات غير المُعلَّمة، يتمكّن LPM من استعادة 54% و73% من تقليل معدل أخطاء الكلمات على مجموعتي اختبار نظيفتين ومشوّشتين مقارنةً بنموذج مُدرَّب بالكامل باستخدام نفس البيانات.

التعرف على الكلام شبه المُراقب من خلال مطابقة الأولويات المحلية | أحدث الأوراق البحثية | HyperAI