MaskNet: إدخال الضرب الواقعي للسمات إلى نماذج التصنيف CTR من خلال قناع موجه بالحالة

تمثّل تقدير معدل النقر (CTR) واحدة من المهام الأساسية في العديد من التطبيقات الواقعية، ويُعد من الضروري لنموذج الترتيب أن يُميّز بشكل فعّال التفاعلات المعقدة من الرتبة العالية. تُستخدم الشبكات العصبية العميقة ذات التدفق الأمامي السطحي على نطاق واسع في العديد من النماذج الحديثة القائمة على الشبكات العصبية العميقة (DNN)، مثل FNN وDeepFM وxDeepFM، لالتقاط التفاعلات بين الميزات من الرتبة العالية بشكل غير مباشر. ومع ذلك، أثبتت بعض الدراسات أن التفاعلات المضافة، وبخاصة الشبكات العصبية ذات التدفق الأمامي، تكون غير فعّالة في التقاط التفاعلات الشائعة بين الميزات. ولحل هذه المشكلة، نُقدّم في هذا العمل عملية ضرب محددة داخل نظام الترتيب القائم على الشبكات العصبية العميقة، وذلك من خلال اقتراح "قناع موجه بالحالة" (instance-guided mask)، الذي يُطبّق عملية الضرب العنصرية (element-wise product) على كل من تمثيلات الميزات (feature embedding) وطبقات التدفق الأمامي، مع توجيهها بناءً على المدخلات الفعلية (الحالة). كما نُحوّل طبقة التدفق الأمامي في نموذج DNN إلى مزيج من التفاعلات المضافة والمضروبة، وذلك من خلال اقتراح "MaskBlock" في هذا البحث. يدمج MaskBlock بين التطبيع الطبقي (layer normalization)، والقناع الموجه بالحالة، وطبقة التدفق الأمامي، ويُعد وحدة بناء أساسية يمكن استخدامها لتصميم نماذج ترتيب جديدة بتكوينات مختلفة. يُسمّى النموذج المكوّن من MaskBlock باسم MaskNet في هذا العمل، كما نُقدّم نموذجين جديدين من MaskNet لإظهار فعالية MaskBlock كوحدة بناء أساسية في بناء نماذج ترتيب عالية الأداء. وأظهرت نتائج التجارب على ثلاث مجموعات بيانات واقعية أن نماذج MaskNet المقترحة تتفوّق بشكل ملحوظ على النماذج الحالية مثل DeepFM وxDeepFM، مما يدل على أن MaskBlock يُعد وحدة بناء فعّالة لبناء نماذج ترتيب جديدة عالية الأداء.