نماذج Transformers ذات الميزات متعددة الوسائط والسياق ما بعد الدمج للإرشاد القائم على الجلسة في التجارة الإلكترونية

يُعدّ التوصية القائمة على الجلسة مهمةً في خدمات التجارة الإلكترونية، حيث يتصفح عدد كبير من المستخدمين الموقع بشكل مجهول أو قد يكون لديهم اهتمامات مختلفة تمامًا بين الجلسات المختلفة. في هذا البحث، نقدّم واحدة من الحلول الفائزة في مهمة التوصية ضمن ورشة عمل SIGIR 2021 للتحدي الخاص بالبيانات التجارية الإلكترونية. وقد استلهمت حلولنا من تقنيات معالجة اللغة الطبيعية، وتشمل تجميعًا لاثنين من هياكل المحولات (Transformer) – Transformer-XL وXLNet – تم تدريبهما باستخدام نهجين: التنبؤ التسلسلي (autoregressive) والتشفير التلقائي (autoencoding). وللاستفادة القصوى من مجموعة البيانات الغنية التي تم توفيرها للمنافسة، نُفصّل في كيفية إعداد ميزات متعددة النماذج من خلال دمج الأحداث الجدولية مع المتجهات النصية والصورية. كما نقدّم تحليلًا لتنبؤات النموذج لفهم أفضل لفعالية هياكلنا في مهام التوصية القائمة على الجلسة.