DCN V2: تحسين الشبكة العميقة والمتقاطعة ودروس عملية لأنظمة الترتيب القائمة على التعلم على نطاق الويب

إن تعلُّم التفاعلات الفعّالة بين الخصائص (feature crosses) هو المفتاح وراء بناء أنظمة التوصية. ومع ذلك، فإن الفضاء الواسع والمتفرّق للخصائص يتطلب بحثًا مُفصّلًا لتحديد التفاعلات الفعّالة. وقد تم اقتراح الشبكة العميقة والمتعددة التفاعل (Deep & Cross Network - DCN) بهدف تعلُّم تفاعلات الخصائص التنبؤية ذات الدرجة المحدودة تلقائيًا وبنجاعة. ومع ذلك، في النماذج التي تُقدّم خدمات على نطاق واسع عبر الإنترنت، وباستخدام مليارات الأمثلة التدريبية، أظهرت شبكة التفاعل في DCN قدرة تعبيرية محدودة في تعلُّم تفاعلات خصائص أكثر تنبؤًا. وعلى الرغم من التقدم الكبير في الأبحاث، لا يزال العديد من نماذج التعلم العميق المستخدمة في البيئات الإنتاجية تعتمد على الشبكات العصبية التغذوية الأمامية التقليدية لتعلُّم التفاعلات بين الخصائص بطريقة غير فعّالة.بالنظر إلى المزايا والعيوب التي تتمتع بها DCN والطرق الحالية لتعلُّم التفاعلات بين الخصائص، نقترح إطارًا مُحسَّنًا يُسمّى DCN-V2، بهدف جعل DCN أكثر ملائمة للبيئات الصناعية الكبيرة. وفي دراسة تجريبية شاملة تشمل بحثًا واسعًا في القيم المُعطاة (hyper-parameters) وضبط النموذج، لاحظنا أن DCN-V2 تتفوّق على جميع الخوارزميات الرائدة في المجال على مجموعات بيانات معيارية شهيرة. ويتميز DCN-V2 المُحسَّن بقدرته التعبيرية الأعلى مع الحفاظ على الكفاءة من حيث التكلفة في تعلُّم التفاعلات بين الخصائص، خاصة عند دمجه مع بنية مزيج من الرتبة المنخفضة (low-rank architecture). ويُعد DCN-V2 بسيطًا، ويمكن دمجه بسهولة كوحدات بناء، وقد أدى إلى تحسينات كبيرة في دقة النموذج خارج الخط (offline accuracy) ومقاييس الأعمال الفعلية (online business metrics) في العديد من أنظمة التعلم المرتبة (learning to rank) على نطاق واسع في Google.