المحولات هي تصنيفات نصية قصيرة: دراسة حول تصنيفات نصية قصيرة استنتاجية على مجموعات بيانات معيارية وبيانات واقعية

تصنيف النصوص القصيرة يُعد جزءًا حاسمًا وصعبًا في معالجة اللغة الطبيعية. ولذلك، توجد العديد من فئات التصنيف المخصصة للغاية للنصوص القصيرة. ومع ذلك، في الأبحاث الحديثة المتعلقة بالنصوص القصيرة، لم تُستغل بشكل كامل الطرق المتطورة (SOTA) لتصنيف النصوص التقليدية، وخاصة استخدام نماذج Transformers بشكل بحت. في هذا العمل، نقوم بتحليل أداء مجموعة متنوعة من فئات التصنيف للنصوص القصيرة، بالإضافة إلى أفضل نموذج تقليدي في التصنيف النصي. كما نستكشف تأثير هذه النماذج على مجموعتين جديدتين من البيانات الحقيقية للنصوص القصيرة، بهدف التصدي لمشكلة الاعتماد المفرط على مجموعات بيانات معيارية محدودة الخصائص. تُظهر تجاربنا بشكل لا لبس فيه أن نماذج Transformers تحقق أفضل دقة محققة (SOTA) في مهام تصنيف النصوص القصيرة، مما يثير سؤالًا جوهريًا حول ما إذا كانت الحاجة إلى تقنيات مخصصة للنصوص القصيرة ما زالت ضرورية.