HyperAIHyperAI
منذ 17 أيام

EnCLAP++: تحليل إطار EnCLAP لتحسين أداء التسمية التوضيحية الصوتية التلقائية

Jaeyeon Kim, Minjeon Jeon, Jaeyoon Jung, Sang Hoon Woo, Jinjoo Lee
EnCLAP++: تحليل إطار EnCLAP لتحسين أداء التسمية التوضيحية الصوتية التلقائية
الملخص

في هذا العمل، نهدف إلى تحليل وتحسين إطار EnCLAP، وهو نموذج من الطراز الرائد في التسمية التلقائية للصوت. ندرس تأثير تعديل مكونات المُشفر الصوتي، ونستكشف التدريب المسبق باستخدام مجموعات بيانات بمقاييس مختلفة، ونُجري دراسة حول فعالية خطة إعادة ترتيب. من خلال تجارب واسعة وتحليل كمي للنصوص المولدة، نطوّر نسخة مُحسّنة تُعرف بـ EnCLAP++، التي تتفوّق بشكل ملحوظ على النموذج الأصلي.

EnCLAP++: تحليل إطار EnCLAP لتحسين أداء التسمية التوضيحية الصوتية التلقائية | أحدث الأوراق البحثية | HyperAI