ديشو يلتقي إليوت: مقاييس مرجعية على نطاق واسع للترشيح متعدد الوسائط

في مجالات محددة مثل الموضة والموسيقى وتوصيات الأفلام، قد تؤثر الخصائص المتعددة الجوانب التي تميز المنتجات والخدمات على كل عميل في منصات البيع عبر الإنترنت بشكل مختلف، مما يفتح الباب أمام نماذج توصية متعددة الوسائط جديدة قادرة على التعلم من هذا المحتوى متعدد الوسائط. وفقًا للأدبيات، تتضمن عملية التوصية المتعددة الوسائط الشائعة (i) استخراج الخصائص المتعددة الوسائط، (ii) تحسين تمثيلاتها عالية المستوى لتتناسب مع مهمة التوصية، (iii) دمج جميع الخصائص المتعددة الوسائط بشكل اختياري، و(iv) التنبؤ بدرجة المستخدم-العنصر. بينما بُذلت جهود كبيرة لتصميم حلول مثلى لـ (ii-iv)، فإننا إلى أقصى درجة من المعرفة لم نجد اهتمامًا كبيرًا بدراسة الإجراءات المتعلقة بـ (i). في هذا السياق، تشير الأدبيات الموجودة إلى توفر كميات كبيرة من مجموعات البيانات متعددة الوسائط والمزيد والمزيد من النماذج الكبيرة التي تأخذ في الاعتبار المهام متعددة الوسائط، ولكن (في الوقت نفسه) يتم استخدام حلول معيارية محدودة بطريقة غير مبررة. هذا ما يحثنا على استكشاف تقنيات أوسع للمرحلة (i) من العملية. لهذا الغرض، يقدم هذا البحث أول محاولة لتقديم مقاييس شاملة على نطاق واسع لأنظمة التوصية متعددة الوسائط، مع التركيز بشكل خاص على مستخرجات البيانات المتعددة الوسائط. وبشكل خاص، نستفيد من إطارين شائعين ومحدثين لاستخراج الخصائص المتعددة الوسائط وإعادة إنتاجها في مجال التوصية، وهما Ducho وElliot، لنقدم بيئة تجريبية موحدة وجاهزة للاستخدام قادرة على تنفيذ تحليلات مقاييس شاملة تستفيد من مستخرجات البيانات المتعددة الوسائط الجديدة. وقد أظهرت النتائج، التي تم التحقق منها بشكل كبير تحت إعدادات مختلفة للمعلمات الفوقية للمستخرجات المختارة، رؤى مهمة حول كيفية تدريب ضبط خوارزميات التوصية متعددة الوسائط الجيل القادم.