TF4CTR: إطار تركيزي مزدوج للتنبؤ بـ CTR من خلال التمييز المتكيف للعينات

يُعدّ نمذجة التفاعل الفعّالة بين الميزات أمرًا بالغ الأهمية لتعزيز دقة توقع معدل النقر (CTR) في أنظمة التوصية الصناعية. تعتمد معظم النماذج العميقة الحالية لـ CTR على بناء هياكل شبكات معقدة لالتقاط تفاعلات الميزات المعقدة أو سلوك المستخدم بشكل أفضل. ومع ذلك، نحدد هاتين المشكلتين في هذه النماذج: (1) أن العينات المقدمة للنموذج تكون غير مميزة، مما قد يؤدي إلى تعلم النموذج لعدد كبير من العينات السهلة بطريقة أحادية، بينما يتجاهل عددًا أصغر من العينات الصعبة، وبالتالي يقلل من قدرة النموذج على التعميم؛ (2) تم تصميم مشغّلات تفاعل الميزات المميزة لالتقاط معلومات تفاعلات مختلفة، لكنها تتلقى إشارات مراقبة متماثلة، مما يحد من فعالية هذه المشغّلات. ولسد الفجوات المحددة، تقدّم هذه الورقة إطارًا جديدًا لتوقع CTR من خلال دمج خسارة Twin Focus (TF) القابلة للتركيب، ووحدة تضمين اختيار العينات (SSEM)، ووحدة التجميع الديناميكية (DFM)، واسمها الإطار المزدوج التركيز لتوقع CTR (TF4CTR). وبشكل خاص، يستخدم الإطار وحدة SSEM في الجزء السفلي من النموذج لتمييز العينات، مما يسمح بتعيين مشغّل مناسب لكل عينة. في الوقت نفسه، تُقدّم خسارة TF إشارات مراقبة مخصصة لكل من المشغّلات البسيطة والمعقدة. علاوةً على ذلك، تقوم وحدة DFM بدمج معلومات تفاعل الميزات التي تلتقطها المشغّلات بشكل ديناميكي، مما يؤدي إلى توقعات أكثر دقة. وقد أكدت التجارب على خمسة مجموعات بيانات حقيقية فعالية الإطار وتوافقه، مُظهرة قدرته على تحسين العديد من النماذج الأساسية الممثلة بطريقة لا تعتمد على النموذج. ولتعزيز الأبحاث القابلة لإعادة الإنتاج، سيتم توفير الكود المفتوح المصدر وسجلات التشغيل التفصيلية عبر الرابط التالي: https://github.com/salmon1802/TF4CTR.