منذ 15 أيام
تثبيت تعيين التسميات لفصل الصوت من خلال التدريب المسبق المستقل عن الإشراف
Sung-Feng Huang, Shun-Po Chuang, Da-Rong Liu, Yi-Chen Chen, Gene-Ping Yang, Hung-yi Lee

الملخص
تم تطوير فصل الكلام بشكل جيد، مع اعتماد نهج تدريب معين غير مُتَبَدِّل (PIT) الذي حقق نجاحًا كبيرًا، مع أن التبديل المتكرر في تعيين التسميات الذي يحدث أثناء تدريب PIT لا يزال يُعد مشكلة عندما نسعى إلى سرعة تقارب أفضل وأداء مُحَقَّق أعلى. في هذه الورقة، نقترح إجراء تدريب مُسبق ذاتي التوجيه (self-supervised pre-training) لاستقرار تعيين التسميات أثناء تدريب نموذج فصل الكلام. أظهرت التجارب التي أُجريت على عدة أنواع من النُهج الذاتية التوجيه، وعدد من نماذج فصل الكلام الشائعة، وبيانات مُختلفة، أن تحسينات كبيرة يمكن تحقيقها إذا تم اختيار نهج ذاتي توجيه مناسب.