التعلم شبه المراقب المتعدد المهام للتصنيف السردي غير المتوازن من حيث الفئات

مع تطور أنماط التسمية بمرور الوقت، تصبح الفروقات البسيطة كافية لجعل المجموعات القديمة من البيانات غير قابلة للاستخدام. وهذا يمنع الباحثين من بناء أعمالهم على التسميات السابقة، مما يؤدي إلى وجود العديد من مجموعات البيانات الصغيرة غير المتوازنة من حيث الفئات، خصوصًا في مجال تعلّم السياق. في هذا العمل، نُظهر أن نهج التعلّم متعدد المهام يمكنه دمج مجموعات بيانات السياق من مجالات متشابهة ومتنوعة لتحسين تصنيف السياق. ونُظهر تحسنًا بنسبة 4.9% في مقياس F1-الصغير مقارنةً بأفضل النماذج الحالية على مجموعة بيانات NewsDiscourse، إحدى أكبر مجموعات بيانات السياق التي تم نشرها حديثًا، وذلك جزئيًا بفضل الارتباطات بين التسميات عبر المهام، التي تُحسّن الأداء بالنسبة للفئات غير الممثلة بشكل كافٍ. كما نقدّم مراجعة شاملة للتقنيات الإضافية المقترحة لمعالجة مشكلات نقص الموارد في معالجة اللغة الطبيعية، ونُظهر أن لا واحدة من هذه النماذج قادرة على تحسين دقة التصنيف في بيئة بحثنا.