منذ 17 أيام
EnCLAP++: تحليل إطار EnCLAP لتحسين أداء التسمية التوضيحية الصوتية التلقائية
Jaeyeon Kim, Minjeon Jeon, Jaeyoon Jung, Sang Hoon Woo, Jinjoo Lee

الملخص
في هذا العمل، نهدف إلى تحليل وتحسين إطار EnCLAP، وهو نموذج من الطراز الرائد في التسمية التلقائية للصوت. ندرس تأثير تعديل مكونات المُشفر الصوتي، ونستكشف التدريب المسبق باستخدام مجموعات بيانات بمقاييس مختلفة، ونُجري دراسة حول فعالية خطة إعادة ترتيب. من خلال تجارب واسعة وتحليل كمي للنصوص المولدة، نطوّر نسخة مُحسّنة تُعرف بـ EnCLAP++، التي تتفوّق بشكل ملحوظ على النموذج الأصلي.