HyperAIHyperAI
منذ 11 أيام

FCN: دمج الشبكة العصبية العابرة الأسية والخطية لتنبؤ معدل النقر

Honghao Li, Yiwen Zhang, Yi Zhang, Hanwei Li, Lei Sang, Jieming Zhu
FCN: دمج الشبكة العصبية العابرة الأسية والخطية لتنبؤ معدل النقر
الملخص

بصفتها نموذجًا مهمًا في التنبؤ بمعدل النقر (CTR)، اكتسبت نماذج الشبكة العميقة والمتقاطعة (DCN) ونماذجها المشتقة شهرة واسعة بشكل رئيسي بفضل نجاحها في تحقيق توازن بين التكلفة الحسابية والأداء. يعتمد هذا النموذج على شبكة تقاطع لتمثيل تفاعلات الميزات بشكل صريح مع نمو خطي، بينما يستخدم الشبكات العصبية العميقة (DNN) لالتقاط تفاعلات الميزات ذات الرتبة العالية بشكل غير صريح. ومع ذلك، لا تزال هذه النماذج تواجه عدة قيود رئيسية: (1) يتأخر أداء طرق تفاعل الميزات الصريحة الحالية مقارنةً بـ DNN، مما يؤدي إلى سيطرة أداء النموذج الكلي على DNN؛ (2) على الرغم من ادعاء هذه النماذج التقاط تفاعلات الميزات ذات الرتبة العالية، إلا أنها غالبًا ما تتجاهل الضوضاء المحتملة داخل هذه التفاعلات؛ (3) يفتقر عملية التدريب لفروع الشبكة المختلفة الخاصة بالتفاعلات إلى إشارات مراقبة مناسبة؛ (4) تفاعلات الميزات ذات الرتبة العالية التي تُمكّنها هذه النماذج غالبًا ما تكون غير صريحة وغير قابلة للتفسير بسبب اعتمادها على DNN.لمعالجة القيود المحددة أعلاه، تقدم هذه الورقة نموذجًا جديدًا يُسمى شبكة التقاطع المدمجة (FCN)، إلى جانب شبكتين فرعيتين: شبكة التقاطع الخطية (LCN) وشبكة التقاطع الأسية (ECN). يُمكّن FCN من التقاط تفاعلات الميزات بشكل صريح مع نمو خطي ونوعي (أسي)، مما يُلغِي الحاجة إلى الاعتماد على DNN غير الصريحة. علاوةً على ذلك، نُقدِّم عملية التصفية الذاتية (Self-Mask) التي تقوم بتصفية الضوضاء طبقةً تلو الأخرى، وتقلل من عدد المعاملات في شبكة التقاطع بنسبة 50%. ولتدريب هاتين الشبكتين التقاطعيتين بكفاءة، نُقدِّم دالة خسارة بسيطة ولكنها فعالة تُسمى Tri-BCE، التي توفر إشارات مراقبة مخصصة لكل شبكة. وقد قُمنا بتقييم فعالية وفعالية وقابلية التفسير لـ FCN على ستة مجموعات بيانات معيارية. علاوةً على ذلك، من خلال دمج LCN و ECN، حقق FCN أداءً جديدًا في مستوى الحالة الحالية (state-of-the-art).

FCN: دمج الشبكة العصبية العابرة الأسية والخطية لتنبؤ معدل النقر | أحدث الأوراق البحثية | HyperAI