شأنها في ذلك دراسة حالة "دورو داش": كيف تتفوق الشبكات العصبية العميقة على نماذج شجرة القرار التقليدية في تصنيف الإعلانات للتجارة الإلكترونية
ملخص مقال "DNNs مقابل النماذج الشجرية التقليدية في تصنيف الإعلانات الإلكترونية" السياق خلال عقد من الزمن في بناء وتحسين أنظمة الإعلانات لدى شركة Meta، شهدت تطورات كبيرة في نظام الإعلانات عبر الإنترنت، بدءًا من استراتيجيات عرض الإعلانات البسيطة وحتى المنصات المعقدة التي تركز على التحويلات. تلعب أنظمة تصنيف الإعلانات دورًا محوريًا في نجاح الإعلانات الرقمية، حيث تقوم بقياس أهداف مختلفة مثل الوعي بالعلامة التجارية، الترويج، التحويلات إعادة الاستهداف. تستخدم المنصات الإعلانية الإلكترونية مثل DoorDash و Airbnb نموذج التكلفة لكل عملية تحويل (CPA) لأنه يضمن أن المعلنين يدفعون فقط عند حدوث العمل المطلوب، مثل الشراء أو التسجيل. لماذا لم تعد النماذج الشجرية كافية؟ بالرغم من فعالية النماذج الشجرية، مثل الأشجار القرارية المدعومة بالتقريب التدرجي (GBDT)، في التعامل مع البيانات الكبيرة والمتعددة الأبعاد والمتنوعة، فقد أصبحت قاصرة عن التقاط التعقيد والتنوع في تفاعلات المستهلكين. هذا أدى إلى ضرورة الانتقال إلى نماذج الشبكات العصبية العميقة (DNNs)، التي تتميز بقدرتها على معالجة البيانات الكبيرة والمتنوعة والمؤقتة، بالإضافة إلى إمكانية مشاركة المعرفة بين المجالات المختلفة من خلال التعلم الانتقالي، ونمذجة سلوك المستخدم بشكل شامل عبر التعلم متعدد المهام (MTL). عملية الانتقال وتحدياتها خطوة 1: تعريف النقطة المرجعية يقوم أي منصة إعلانية عبر الإنترنت على مكونين رئيسيين: 1. خدمة تدريب النموذج — عملية خارج خط تستخدم سجلات التوقعات والتفاعل السابقة لتدريب نماذج جديدة. 2. خدمة تبادل الإعلانات — نظام داخل خط يستخدم بيانات الطلب المetadata ونماذج التدريب لتصنيف الإعلانات في المزايدات الفورية. كما أن آليات تسجيل البيانات القوية ضرورية لجمع بيانات عالية الجودة لتدريب النماذج المستمر. قبل الانتقال إلى نظام جديد، يجب تحديد نقطة مرجعية قوية لضمان أن الحل الجديد يلبي المعايير الأداء اللازمة ويُقلل المخاطر بينما يُحقق قيمة أعمال أكبر. خطوة 2: تدريب وتقييم النموذج يُعتبر طبقة التطبيع (Normalization Layers) عنصرًا حاسمًا في معالجة البيانات قبل إدخالها إلى الشبكة العصبية الرئيسية. يتم توزيع الأعباء الحسابية بين المعالجات المركزية (CPU) والمعالجات الرسومية (GPU) لتحقيق أعلى معدل تدريب. تم تصميم تدفق البيانات وتخصيص الموارد بعناية لتقليل العقبات وزيادة كفاءة الأجهزة وتسريع عملية التدريب. استخدمت DoorDash مؤشرات مثل منحنى المنطقة تحت المنحنى (AUC) والخطأ المتقاطع الثنائي المُعَدَّل (Normalized BCE) لتقييم أداء النموذج. خطوة 3: مراحل تطور النموذج 3.1 تبني نماذج التوصية العميقة أظهرت تجارب A/B الفورية أن النماذج العصبية العميقة أدت إلى نتائج إيجابية ملحوظة مقارنة بالنماذج الشجرية. تضمنت الخطوات التالية استكشاف تصاميم معمارية محددة لنماذج DNNs وفرص هندسة الميزات باستخدام بيانات التدريب المسجلة. رغم أن إضافة ميزات نادرة (Sparse Features) في البداية أظهرت مكاسب طفيفة، فإن زيادة حجم الميزات أدت إلى مشاكل مثل الانسياق الزائد للنموذج، مما زاد الفجوة بين الأداء خارج الخط والداخله. 3.2 التخصيص العميق تُظهر البيانات أن مستخدمي DoorDash لديهم اتجاه قوي لإعادة الشراء وترددهم في استكشاف خيارات جديدة. كما أن الوقت الذي يتم فيه تقديم الطلب يؤثر بشكل كبير على قرارات المستخدمين. لمعالجة هذه الرؤى، تم إنشاء ميزات جديدة لتقاطع البيانات الزمنية (Daypart)، تفضيلات المستخدمين للمتاجر والأطباق، وحساسية السعر الكلية. تم أيضًا إدخال متجهات تم التدريب عليها (Pre-trained Embeddings) لتخفيف مشكلة بدء التشغيل البارد (Cold Start) ونقص البيانات. ساهمت هذه التعديلات في تحسين معدل التحويل (CVR) بنسبة حوالي 2.8%. 3.3 إغلاق الحلقة: تقليص الفجوة بين تدريب النماذج خارج الخط وأدائها داخله بعد جميع التحسينات، ظلت هناك فجوة بنسبة 4.3% في AUC بين تقييم النموذج خارج الخط وأدائه الفعلي. تم حسم هذا الاختلاف بسبب تأخير بيانات الميزات أو قيم المخزن المؤقت القديمة (Cached Residuals). لمعالجة الميزات المفقودة، تم تنفيذ نوافذ انضمام خاصة بالميزات لتحسين التعامل مع التأخيرات المعروفة. ومع ذلك، لم يكن هذا الحل كافيًا لتحقيق التناسق الكامل. لذا، تم تمكين تسجيل البيانات عبر الإنترنت للميزات الأكثر عرضة للتناقض، مما أدى إلى زيادة الطلب على الموارد النظامية بأكثر من 10%. ومع ذلك، أثبتت المكاسب التجارية من جودة تصنيف الإعلانات وخفض متوسط زمن الاستجابة أن هذه التكلفة الإضافية مبررة. الخاتمة في مجال تصنيف الإعلانات الإلكترونية المتطور، تبرز نماذج الشبكات العصبية العميقة (DNNs) كبديل أفضل للنماذج الشجرية التقليدية. من خلال دراسة حالة إعلانات DoorDash، أظهرت DNNs قدرتها على تمثيل الميزات بشكل أغني، وتقديم تخصيص أعمق، وتطوير هياكل تدريب قابلة للتوسع. لم يُحسن هذا الانتقال دقة النموذج ومعدل التحويل فحسب، بل أثبت أيضًا أنه يمكن تحقيق قيمة أعمال ملموسة مع البنية التحتية والمُحسِّنات المناسبة. لذلك، تعتبر DNNs الأساس القوي لأنظمة تصنيف الإعلانات الجديدة. تقييم الحدث من قبل المختصين رأت العديد من الشركات الرائدة في مجال الإعلانات عبر الإنترنت، مثل Google Play وAirbnb وDoorDash، أن الانتقال إلى DNNs هو خطوة ضرورية لتحسين أداء أنظمتها الإعلانية. تُؤكد هذه الشركات أن النماذج العصبية العميقة تُقدم فرصًا جديدة للتعلم الانتقالي والتخصيص العميق، مما يعزز التجربة الإعلانية للمستهلكين ويُحقق أهداف المعلنين بشكل أكثر فعالية. نبذة تعريفية عن DoorDash DoorDash هي منصة تكنولوجيا توصيل الطعام تأسست عام 2013 في الولايات المتحدة الأمريكية. تُقدم خدماتها للمطاعم والمستهلكين، وتُركز على تحسين تجربة المستخدم من خلال تقنيات الذكاء الاصطناعي والتعلم الآلي. اعتمدت الشركة على نماذج DNNs لتعزيز كفاءة نظام الإعلانات الخاص بها، مما ساهم في زيادة معدل التحويل وتحسين تجربة المستخدم بشكل عام.
