HyperAIHyperAI
منذ 7 أيام

مجموعة صور لاختبار الأنظمة المُوصية باستخدام البكسلات الخام

Yu Cheng, Yunzhu Pan, Jiaqi Zhang, Yongxin Ni, Aixin Sun, Fajie Yuan
مجموعة صور لاختبار الأنظمة المُوصية باستخدام البكسلات الخام
الملخص

لقد حققت أنظمة التوصية (RS) نجاحًا كبيرًا من خلال الاستفادة من ميزات التعرف الصريح (ID). ومع ذلك، لا يزال الاحتمال الكامل لميزات المحتوى، وخاصة ميزات البكسل الصورية النقيّة، غير مستغل بالكامل. وقد عرقل نقص توفر مجموعات بيانات ضخمة ومتنوعة ومرتبطة بالمحتوى لتصنيف الصور، استخدام الصور الخام كتمثيلات للعناصر. في هذا السياق، نقدّم PixelRec، وهي مجموعة بيانات ضخمة تُركّز على الصور، تضم نحو 200 مليون تفاعل بين المستخدمين والصور، و30 مليون مستخدم، و400,000 صورة غلاف عالية الجودة. وبفضل توفير وصول مباشر إلى بكسلات الصور الخام، يمكّن PixelRec النماذج المستخدمة في التوصية من تعلّم تمثيل العناصر مباشرةً من هذه البكسلات. لبيان فاعلية هذه المجموعة، نبدأ بعرض نتائج عدة نماذج أساسية كلاسيكية تعتمد فقط على معرفة الهوية (IDNet)، والتي تم تدريبها على PixelRec. ثم، لتأكيد فعالية ميزات الصور في المجموعة، نستبدل تمثيلات معرف العنصر (itemID) المستمدة من IDNet بمحرك بصري قوي يمثّل العناصر باستخدام بكسلات الصور الخام. تُسمّى هذه النموذج الجديد PixelNet. تشير نتائجنا إلى أن PixelNet يمكنه بالفعل تحقيق أداءً مماثلًا أو حتى أفضل من IDNet، حتى في بيئات التوصية القياسية التي لا تشهد حالة "برد" (non-cold start)، حيث يُعَدّ IDNet فعّالًا جدًا. علاوةً على ذلك، يتميّز PixelNet بمزايا مهمة أخرى مقارنةً بـ IDNet، مثل كونه أكثر فعالية في سيناريوهات التوصية عند البدء من الصفر (cold-start) والانتقال عبر المجالات (cross-domain). تُبرز هذه النتائج الأهمية الكبيرة لميزات البصرية في PixelRec. نعتقد أن PixelRec يمكن أن تُشكّل موردًا حاسمًا وبيئة اختبار مثالية لأبحاث النماذج المستخدمة في التوصية التي تُركّز على محتوى بكسلات الصور. ستكون المجموعة، والكود، وجدول التصنيف متاحين عبر الرابط: https://github.com/westlake-repl/PixelRec.

مجموعة صور لاختبار الأنظمة المُوصية باستخدام البكسلات الخام | أحدث الأوراق البحثية | HyperAI