التعلم المراقب التبايني للتوافق بين المنتجات

في السنوات الأخيرة، تقدم التعلم المُقارن (Contrastive Learning) بشكل كبير في تحسين الأداء على العديد من المهام في مجال الرؤية الحاسوبية والاسترجاع المعلوماتي. يُعدّ هذا الملصق أول عمل يطبّق التعلم المُقارن المُوجّه (Supervised Contrastive Learning) على مهمة مطابقة المنتجات في التجارة الإلكترونية، باستخدام عروض من منصات إلكترونية مختلفة. وبشكل أكثر تحديدًا، نستخدم تقنية التعلم المُقارن المُوجّه لتدريب مُشفّر (encoder) من نوع Transformer بشكل مُسبق، ثم نُعدّله لاحقًا (fine-tune) على مهمة المطابقة باستخدام بيانات تدريب ثنائية (pair-wise). ونُقدّم أيضًا استراتيجية عينة مُتّسقة مع المصدر (source-aware sampling) تسمح بتطبيق التعلم المُقارن في السيناريوهات التي لا تحتوي فيها بيانات التدريب على معرفات منتجات (product identifiers). ونُظهر أن دمج التدريب المُسبق المُقارن المُوجّه مع استراتيجية العينة المُتّسقة مع المصدر يؤدي إلى تحسين ملحوظ في الأداء مقارنة بالحالة المُتطورة حاليًا على عدة معايير شائعة الاستخدام: ففي مجموعة بيانات Abt-Buy، نصل إلى معامل F1 قدره 94.29 (بزيادة قدرها 3.24 مقارنة بالحالة السابقة)، وفي Amazon-Google نصل إلى 79.28 (بزيادة قدرها 3.7). أما في مجموعة بيانات WDC Computers، فإننا نحقق تحسينات تتراوح بين +0.8 و+8.84 في معامل F1، حسب حجم مجموعة التدريب. كما أجرينا تجارب إضافية باستخدام تكبير البيانات (data augmentation) والتدريب المُسبق المُقارن ذاتيًا (self-supervised contrastive pre-training)، ووجدنا أن تكبير البيانات يمكن أن يكون مفيدًا بشكل خاص في حالات مجموعات التدريب الصغيرة، في حين أن التدريب المُسبق المُقارن ذاتيًا يؤدي إلى انخفاض كبير في الأداء بسبب وجود ضجيج في التسميات (label noise) المتأصل في البيانات. وبذلك نستنتج أن التدريب المُسبق المُقارن يتمتع بإمكانات عالية لتطبيقات مطابقة المنتجات، خصوصًا في السيناريوهات التي تتوفر فيها إشراف صريح (explicit supervision).