التنبؤ بالشعبية البصرية للمنتجات الأزيائية الجديدة باستخدام الانحدار شبه التلقائي متعدد الوسائط

تقدير تفضيلات المستهلكين يعتبر من أهم الأولويات لصناعة الأزياء، حيث يمكن أن يكون استخدام هذه المعلومات بشكل صحيح مفيدًا من حيث الربح. اكتشاف الاتجاهات في مجال الأزياء هو مهمة صعبة بسبب السرعة الكبيرة للتغيير في هذه الصناعة. بالإضافة إلى ذلك، التنبؤ بشعبية التصاميم الجديدة للملابس بصريًا يعد أكثر تحديًا بسبب نقص البيانات التاريخية. لهذا الغرض، نقترح نظام MuQAR (Multimodal Quasi-AutoRegressive)، وهو هندسة تعلم عميقة متعددة الوسائط تجمع بين وحدتين: (1) شبكة متعددة الطبقات ومتنوعة الوسائط تعالج الخصائص الفئوية والبصرية والنصية للمنتج، و(2) شبكة عصبية شبه ذاتية الرجع تُمثِّل سلسلة زمنية "هدف" لخصائص المنتج مع سلسلة زمنية "خارجية" لجميع الخصائص الأخرى.نستخدم رؤية الحاسوب، تصنيف الصور ووصف الصور، لاستخراج الخصائص البصرية والوصف النصي تلقائيًا من صور المنتجات الجديدة. تصميم المنتج في مجال الأزياء يتم التعبير عنه أولًا بشكل بصرى، وهذه الخصائص تمثل خصوصيات المنتج دون التدخل في عملية الإبداع الخاصة بمصمميها عن طريق طلب مدخلات إضافية (مثل النصوص المكتوبة يدويًا). نستعمل سلسلة زمنية خواص الهدف للمنتج كوكيل لأنماط الشعبية الزمنية، مما يخفف من مشكلة نقص البيانات التاريخية، بينما تساعد السلسلة الزمنية الخارجية على التقاط الاتجاهات بين الخواص المرتبطة.نقوم بتحليل استبعادي شامل على قاعدتي بيانات الأزياء ذات الحجم الكبير Mallzee وSHIFT15m لتقييم كفاءة MuQAR، كما نستخدم مجموعة بيانات آراء أمازون: المنزل والمطبخ لتقييم قابلية التعميم إلى مجالات أخرى. دراسة مقارنة على مجموعة بيانات VISUELLE أظهرت أن MuQAR قادر على المنافسة وتخطي مستوى الأداء الحالي في المجال بنسبة 4.65% و4.8% فيما يتعلق بـ WAPE وMAE على التوالي.