منذ 2 أشهر
تقييم المقالات بشكل آلي باستخدام نواة السلاسل وتمثيلات الكلمات
Mădălina Cozma; Andrei M. Butnaru; Radu Tudor Ionescu

الملخص
في هذا البحث، نقدم منهجية تعتمد على دمج نواة السلاسل (string kernels) وتمثيلات الكلمات (word embeddings) لتصحيح المقالات تلقائيًا. تلتقط نواة السلاسل التشابه بين السلاسل من خلال عد الن-грамات المشتركة للأحرف، وهي نوع من الخصائص منخفض المستوى ولكنها قوية، مما أظهرت نتائجًا رائدة في مهام تصنيف النصوص المختلفة مثل تحديد اللهجة العربية أو تحديد اللغة الأصلية. حسب علمنا، نحن أول من طبق نواة السلاسل لتصحيح المقالات تلقائيًا. كما أننا أول من دمجها مع تمثيل خاص بالمعاني على مستوى عالٍ، وهو ما يعرف بحقيبة تمثيلات الكلمات الفائقة (bag-of-super-word-embeddings). نبلغ عن أفضل الأداء على مجموعة بيانات جائزة تقييم الطلاب الآلية، سواء في الإعداد داخل المجال أو عبر المجالات، متفوقين على أحدث الأساليب الرائدة في التعلم العميق.