HyperAIHyperAI
منذ شهر واحد

حول صعوبة تقييم النماذج الأولية: دراسة على أنظمة التوصية

Steffen Rendle; Li Zhang; Yehuda Koren
حول صعوبة تقييم النماذج الأولية: دراسة على أنظمة التوصية
الملخص

تقوم التقييمات العددية مع المقارنات بالأسس المرجعية بدور محوري عند تقييم الأبحاث في أنظمة التوصية. في هذا البحث، نوضح أن تشغيل الأسس المرجعية بشكل صحيح هو أمر صعب. نبين هذه المشكلة على مجموعتين من البيانات تم دراستهما بشكل واسع. أولاً، نظهر أن النتائج للأسس المرجعية التي تم استخدامها في العديد من النشرات خلال الخمس سنوات الماضية لمعيار Movielens 10M غير مثلى. من خلال إعداد دقيق لأساس تحليل العوامل المصفوفي البسيط (vanilla matrix factorization)، لم نتمكن فقط من تحسين النتائج المبلغ عنها لهذا الأساس، بل حتى تفوقنا على النتائج المبلغ عنها لأي طريقة مقترحة حديثاً. ثانياً، نستعرض الجهد الهائل الذي بذلته المجتمع العلمي للحصول على نتائج عالية الجودة للطرق البسيطة في جائزة Netflix. تشير نتائجنا إلى أن النتائج التجريبية في الأوراق البحثية تكون مشكوك فيها ما لم يتم الحصول عليها في مقاييس معيارية تم ضبطها بشكل كبير من قبل المجتمع العلمي.

حول صعوبة تقييم النماذج الأولية: دراسة على أنظمة التوصية | أحدث الأوراق البحثية | HyperAI