هوبولار: الشبكات الهوبفيلد الحديثة للبيانات الجدولية

بينما تتفوق التعلم العميق في البيانات المنظمة كما تُواجه في مجالات الرؤية الحاسوبية ومعالجة اللغة الطبيعية، إلا أنه فشل في تحقيق التوقعات عند التعامل مع البيانات الجدولية (tabular data). في هذا السياق، تُعدّ نماذج آلات الدعم التمييزية (SVMs) والغابات العشوائية (Random Forests) وتحسين التدرج (Gradient Boosting) أفضل التقنيات أداءً، حيث يتصدرها تحسين التدرج. في الآونة الأخيرة، شهدنا انتشارًا لأساليب التعلم العميق المُصممة خصيصًا للبيانات الجدولية، لكنها ما زالت تُظهر أداءً أقل مقارنةً بتحسين التدرج، خصوصًا في المجموعات الصغيرة من البيانات. نقترح "هوبولار" (Hopular)، وهي معمارية جديدة للتعلم العميق مخصصة للمجموعات المتوسطة والصغيرة من البيانات، حيث يتميز كل طبقة بوجود شبكات هوبفيلد الحديثة (continuous modern Hopfield networks). تعتمد شبكات هوبفيلد الحديثة على البيانات المخزنة للكشف عن العلاقات بين الميزات (feature-feature)، وبين الميزات والهدف (feature-target)، وبين العينات (sample-sample). تكمن ميزة "هوبولار" في قدرة كل طبقة على الوصول مباشرة إلى المدخلات الأصلية، وكذلك إلى كامل مجموعة التدريب من خلال البيانات المخزنة في شبكات هوبفيلد. وبالتالي، يمكن لـ "هوبولار" تحديث نموذجها الحالي والتنبؤ الناتج بشكل تدريجي في كل طبقة، تمامًا كما تفعل الخوارزميات التكرارية القياسية للتعلم. وقد أظهرت التجارب على مجموعات بيانات جدولية صغيرة (بعدد عينات أقل من 1000) أن "هوبولار" تتفوق على تحسين التدرج، والغابات العشوائية، وآلات الدعم التمييزية، وبشكل خاص على عدة أساليب للتعلم العميق. كما أظهرت نتائج التجارب على مجموعات بيانات جدولية متوسطة الحجم (بحوالي 10,000 عينة) تفوق "هوبولار" على XGBoost وCatBoost وLightGBM، بالإضافة إلى أسلوب حديث متقدم للتعلم العميق مصمم خصيصًا للبيانات الجدولية. وبذلك، تُعدّ "هوبولار" بديلًا قويًا لهذه الأساليب في معالجة البيانات الجدولية.