DeepFM: شبكة عصبية قائمة على آلة التحليل إلى عوامل للتنبؤ بمعدل النقرات

فهم التفاعلات المعقدة للخصائص وراء سلوك المستخدمين أمر حاسم في تحقيق أقصى استفادة من معدل النقر (CTR) لأنظمة التوصية. على الرغم من التقدم الكبير، فإن الطرق الحالية تبدو متحيزة بشدة نحو التفاعلات من الرتبة المنخفضة أو المرتفعة، أو تتطلب هندسة خصائص متخصصة. في هذا البحث، نوضح أنه يمكن اشتقاق نموذج تعلم شامل يركز على التفاعلات من الرتبة المنخفضة والمرتفعة على حد سواء. النموذج المقترح، DeepFM، يجمع بين قوة آلات العوامل (Factorization Machines) للتوصية وقوة التعلم العميق لتعلم الخصائص في بنية شبكة عصبية جديدة. بالمقارنة مع أحدث نموذج "واسع وعميق" (Wide & Deep) من جوجل، يتميز DeepFM بوجود مدخل مشترك لجزئيه "الواسع" و"العميق"، دون الحاجة إلى هندسة الخصائص باستثناء الخصائص الأولية. تم إجراء تجارب شاملة لإظهار فعالية وكفاءة DeepFM مقارنة بالنماذج الحالية لتنبؤ معدل النقر (CTR)، باستخدام بيانات المعايير وأيضًا البيانات التجارية.