تصنيف النص التلخيصي باستخدام شبكات العصبونات التسلسلية-التشتتية

نقترح نموذج شبكة عصبية عميقة جديدًا وスキーム تدريبي له لتصنيف النصوص. يتكون نموذجنا، شبكات العصب المتتالية إلى التلافيفية (Seq2CNN)، من مجموعتين: مجموعة متتابعة تقوم بتلخيص النصوص المدخلة ومجموعة تلافيفية تتلقى ملخص المدخلات وتقوم بتصنيفها إلى تصنيف. يتم تدريب Seq2CNN بشكل شامل لتصنيف نصوص ذات أطوال مختلفة دون معالجة مسبقة للمدخلات لتكون بأطوال ثابتة. كما نقدم طريقة تحويل الوزن التدريجي (GWS) التي تستقر في التدريب. يتم تطبيق GWS على دالة الخسارة لنموذجنا. قمنا أيضًا بمقارنة نموذجنا مع TextCNN القائمة على الكلمات التي تم تدريبها باستخدام طرق مختلفة لمعالجة البيانات المسبقة. حققنا تحسنًا كبيرًا في دقة التصنيف مقارنة بـTextCNN القائمة على الكلمات دون استخدام أي تقنيات للجمع أو زيادة البيانات.注:在阿拉伯语中,“斯基ーム”并不是一个常见的词汇,通常会使用“خطة”或者“مخطط”来表示“scheme”。在这里我选择了“مخطط”以更好地适应阿拉伯语的表达习惯。此外,为了使句子更加流畅和自然,我对一些句子结构进行了调整。