طبقة التضمين المتكررة للمانيفولد المُتعلمة من البيانات الناقصة للبحث عن الصور على نطاق واسع

الطرق الحالية لتعلم ال 다양يات (manifold) ليست مناسبة للمهمة استرجاع الصور، لأن معظمها غير قادرة على معالجة صورة الاستفسار (query image)، ولديها تكلفة حسابية إضافية كبيرة خاصة بالنسبة للقواعد البيانات الكبيرة. لذلك، نقترح طبقة التضمين المتكرر للتنوعات (Iterative Manifold Embedding - IME)، والتي يتم تعلم أوزانها خارج الخط (off-line) باستخدام استراتيجية بدون إشراف (unsupervised strategy)، لاستكشاف التنوعات الداخلية باستخدام بيانات غير كاملة. في قاعدة البيانات الكبيرة التي تحتوي على 27000 صورة، تكون طبقة IME أكثر من 120 مرة أسرع من باقي طرق تعلم التنوعات في تضمين التمثيلات الأصلية عند وقت الاستفسار (query time). نقوم بتضمين الوصفيات الأصلية للصور في قاعدة البيانات، والتي تقع على تنوع في فضاء ذي بُعد عالي، إلى تمثيلات مبنية على التنوع بشكل متكرر لتوليد تمثيلات IME في مرحلة التعلم خارج الخط. وفقًا للوصفيات الأصلية وتمثيلات IME للصور في قاعدة البيانات، نقدر أوزان طبقة IME باستخدام الانحدار الجسدي (ridge regression). في مرحلة الاسترجاع عبر الإنترنت (on-line retrieval stage)، نستخدم طبقة IME لرسم الخريطة بين التمثيل الأصلي لصورة الاستفسار بتكلفة زمنية قليلة جدًا (2 ميلي ثانية). نجري التجارب على خمسة مجموعات بيانات عامة ومعيارية لاسترجاع الصور. الطريقة المقترحة لطبقة IME تتفوق بشكل كبير على الطرق ذات العلاقة لتقليل البعد وتعلم التنوعات. بدون معالجة ما بعد الاسترجاع، تحقق طبقتنا IME زيادة في الأداء بالنسبة للطرق الرائدة لاسترجاع الصور مع المعالجة ما بعد الاسترجاع في معظم المجموعات، وتتطلب تكلفة حسابية أقل.