اكتشاف مفاهيم الموضة بشكل تلقائي مع الوعي المكاني

يقترح هذا البحث نهجًا تلقائيًا لاكتشاف المفاهيم ذات الوعي المكاني باستخدام بيانات الصور النصية شبه المصنفة من مواقع التسوق. أولاً، نقوم بضبط شبكة GoogleNet بشكل دقيق من خلال نمذجة صور الملابس ووصفها المقابل في فضاء تمثيلي بصري-دلالي. ثم، لكل خاصية (كلمة)، نولد تمثيلها ذو الوعي المكاني عن طريق الجمع بين متجه الكلمة الدلالي وتمثيلها المكاني المستمد من الخرائط التلافيفية للشبكة المحلاة بدقة. يتم استخدام التمثيلات الناتجة ذات الوعي المكاني لاحقًا لتجميع الخواص في مجموعات متعددة لتشكيل مفاهيم ذات وعي مكاني (مثل: قد يتكون مفهوم الرقبة من خواص مثل الرقبة الحرف V، الرقبة المستديرة، إلخ). أخيرًا، نفكك الفضاء البصري-الدلالي إلى فضاءات جزئية متعددة خاصة بالمفاهيم، مما يسهل التصفح الهيكلي واسترجاع المنتجات بناءً على ردود الفعل الخاصة بالخصائص من خلال استغلال القواعد اللغوية متعددة الأوضاع. قمنا بإجراء تجارب واسعة على مجموعة البيانات الجديدة Fashion200K التي جمعناها، وأظهرت النتائج تقييم جودة التجميع ومهمة استرجاع المنتجات بناءً على ردود الفعل الخاصة بالخصائص فعالية المفاهيم ذات الوعي المكاني التي اكتشفناها تلقائيًا.