منذ 2 أشهر
تبسيط النصوص العصبية بدون إشراف
Sai Surya; Abhijit Mishra; Anirban Laha; Parag Jain; Karthik Sankaranarayanan

الملخص
يقدم البحث محاولة أولى نحو تبسيط النصوص العصبية دون إشراف يعتمد فقط على مجموعات نصوص غير مشمولة بالتصنيف. يتكون الإطار الأساسي من مُشفِّر مشترك وزوج من المُفكِّكات ذات الانتباه، ويكتسب معرفة التبسيط من خلال الخسائر القائمة على التمييز والتخلص من الضوضاء. يتم تدريب الإطار باستخدام نصوص غير مشمولة بالتصنيف تم جمعها من دامب ويكيبيديا الإنجليزية (en-Wikipedia dump). تشير تحليلاتنا (الكمية والنوعية التي تتضمن محكمين بشر) على بيانات اختبار عامة إلى أن النموذج المقترح يمكنه تنفيذ تبسيط النصوص على المستويين اللексي والصرفي، وهو ما يتنافس مع الطرق المشرف عليها الحالية. كما أن إضافة بعض الأزواج المشمولة بالتصنيف تحسن الأداء بشكل أكبر.