الغابة التلافيفية العميقة: نهج تجميع عميق ديناميكي للكشف عن الرسائل العشوائية في النص

أدى الزيادة في استخدام الناس لخدمات المراسلة عبر الهواتف المحمولة إلى انتشار هجمات الهندسة الاجتماعية مثل التصيد الاحتيالي (Phishing)، نظرًا لأن الرسائل العشوائية (Spam) تعد من العوامل الرئيسية في انتشار هذه الهجمات بهدف سرقة بيانات حساسة مثل بطاقات الائتمان وكلمات المرور. بالإضافة إلى ذلك، يتم مشاركة شائعات ومعلومات طبية غير صحيحة حول جائحة كوفيد-19 على وسائل التواصل الاجتماعي بشكل واسع، مما يؤدي إلى خلق حالة من الخوف والارتباك بين الناس. ولهذا، فإن عملية فلترة المحتوى العشوائي أصبحت ضرورية لتقليل المخاطر والتهديدات. اعتمدت الدراسات السابقة على نماذج التعلم الآلي والتعلم العميق لتصنيف الرسائل العشوائية، لكن هذه النماذج تواجه قيودًا رئيسية: فنماذج التعلم الآلي تتطلب هندسة يدوية للميزات، بينما تتطلب الشبكات العصبية العميقة تكاليف حسابية عالية. تقدم هذه الورقة نموذجًا ديناميكيًا متعدد الطبقات (Deep Ensemble) للكشف عن الرسائل العشوائية، يتميز بقدرته على تعديل درجة تعقيده واستخلاص الميزات تلقائيًا. يستخدم النموذج المقترح طبقات تلافيفية (Convolutional) وطبقات تجميع (Pooling) لاستخلاص الميزات، إلى جانب تصنيفات أساسية مثل الغابات العشوائية (Random Forests) وأشجار التصنيف العشوائية المتطرفة (Extremely Randomized Trees) لتصنيف النصوص إلى فئتين: رسائل عشوائية أو مشروعة. علاوة على ذلك، يعتمد النموذج على تقنيات تعلم التجميع مثل التقوية (Boosting) والتجزئة (Bagging). في النتيجة، حقق النموذج أداءً متميزًا من حيث الدقة (Precision) ونسبة الاستدعاء (Recall) ومؤشر F1 والدقة العامة (Accuracy)، حيث بلغت هذه القيم جميعها 98.38%.