تقييم قابلية القراءة للناطقين باللغة الثانية

يتناول هذا البحث مهمة تقييم قابلية القراءة للنصوص الموجهة إلى متعلمي اللغة الثانية (L2). من بين التحديات الرئيسية في هذه المهمة هو نقص البيانات المصنفة حسب المستوى بحجم كبير بشكل كافٍ. لغرض هذا العمل، جمعنا مجموعة بيانات تتكون من نصوص مرتبة وفقًا لمستويات الإطار المرجعي الأوروبي المشترك للغات (CEFR) ومخصصة لمتعلمي اللغة الإنجليزية كلغة ثانية، وقمنا بدراسة تقييم قابلية القراءة للنصوص لكل من الناطقين الأصليين ومتعلمي اللغة الثانية. طبقنا طريقة التعميم لتكييف النماذج التي تم تدريبها على مجموعات بيانات أكبر للناطقين الأصليين لتقدير قابلية القراءة للنصوص لدى المتعلمين، واستكشفنا تقنيات التكيف النطاقي والتعلم الذاتي للاستفادة من البيانات الخاصة بالناطقين الأصليين لتحسين أداء النظام على البيانات المحدودة لمتعلمي اللغة الثانية. في تجاربنا، حقق أفضل نموذج لأداء تقييم قابلية القراءة على نصوص المتعلمين دقةً بلغت 0.797 ومعامل الارتباط اللحظي البيرسوني (PCC) بلغ $0.938$.