استرجاع الصور العميقة: تعلم التمثيلات العالمية للبحث عن الصور

نقترح نهجًا جديدًا لاسترجاع الصور على مستوى المثال. ينتج هذا النهج تمثيلًا عالميًا ومكثفًا بطول ثابت لكل صورة من خلال تجميع العديد من الوصفيات الإقليمية. على عكس الأعمال السابقة التي تستخدم الشبكات العميقة المدربة مسبقًا كصندوق أسود لإنتاج الخصائص، فإن طريقتنا تستفيد من هندسة عميقة مدربة لل مهمة الخاصة باسترجاع الصور. إسهامنا ذو جانبين: (i) نستفيد من إطار الترتيب لتعلم أوزان الالتفاف والتقريب المستخدمة في بناء الوصفيات الإقليمية؛ و (ii) نستخدم شبكة اقتراح المناطق لتعلم أي المناطق يجب جمعها لتشكيل الوصف العالمي النهائي. نوضح أن استخدام بيانات التدريب النظيفة هو أمر حاسم لنجاح نهجنا. لتحقيق هذا الهدف، نستخدم مجموعة بيانات معالم كبيرة ولكن ضوضائية ونطور طريقة تنظيف آلية. ينتج الهيكل المقترح تمثيل صورة عالمي في عملية تمرير واحدة للأمام. يتفوق نهجنا بشكل كبير على الطرق السابقة التي تعتمد على الوصفيات العالمية في المجموعات القياسية للبيانات. بل إنه يتخطى معظم الأعمال السابقة التي تعتمد على فهرسة الوصفيات المحلية الباهظة الثمن والتحقق المكاني. المواد الإضافية متاحة على www.xrce.xerox.com/Deep-Image-Retrieval.