HyperAIHyperAI

Command Palette

Search for a command to run...

حول صعوبة تقييم النماذج الأولية: دراسة على أنظمة التوصية

Steffen Rendle* Li Zhang* Yehuda Koren†

الملخص

تقوم التقييمات العددية مع المقارنات بالأسس المرجعية بدور محوري عند تقييم الأبحاث في أنظمة التوصية. في هذا البحث، نوضح أن تشغيل الأسس المرجعية بشكل صحيح هو أمر صعب. نبين هذه المشكلة على مجموعتين من البيانات تم دراستهما بشكل واسع. أولاً، نظهر أن النتائج للأسس المرجعية التي تم استخدامها في العديد من النشرات خلال الخمس سنوات الماضية لمعيار Movielens 10M غير مثلى. من خلال إعداد دقيق لأساس تحليل العوامل المصفوفي البسيط (vanilla matrix factorization)، لم نتمكن فقط من تحسين النتائج المبلغ عنها لهذا الأساس، بل حتى تفوقنا على النتائج المبلغ عنها لأي طريقة مقترحة حديثاً. ثانياً، نستعرض الجهد الهائل الذي بذلته المجتمع العلمي للحصول على نتائج عالية الجودة للطرق البسيطة في جائزة Netflix. تشير نتائجنا إلى أن النتائج التجريبية في الأوراق البحثية تكون مشكوك فيها ما لم يتم الحصول عليها في مقاييس معيارية تم ضبطها بشكل كبير من قبل المجتمع العلمي.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp