ProxyNCA++: إعادة النظر وتجديده لتحليل المكونات الجوارية باستخدام المرشحات

ننظر إلى مشكلة تعلم قياس المسافة (DML)، حيث يُعدّ الهدف تعلّم قياس فعّال للتشابه بين الصور. نعيد النظر في نموذج ProxyNCA ونُضفي عليه عدة تحسينات. ونكتشف أن التحجيم المنخفض للدرجة الحرارية يُعدّ عنصراً حاسماً للأداء، ونُفسّر سبب فعاليته. علاوة على ذلك، نلاحظ أن تجميع الحد الأقصى العالمي (Global Max Pooling) يُظهر أداءً أفضل بشكل عام مقارنةً بتجميع المتوسط العالمي (Global Average Pooling). بالإضافة إلى ذلك، يعالج المُؤشّر السريع المُقترح مشكلة التدرج الصغير المرتبطة بالمؤشّرات، ويتكامل هذا العنصر جيداً مع التحجيم المنخفض للدرجة الحرارية وتجميع الحد الأقصى العالمي. يحقق النموذج المُحسّن، الذي يُسمّى ProxyNCA++، تحسّناً متوسطاً بنسبة 22.9 نقطة مئوية في مقياس الاسترجاع عند الدرجة الأولى (Recall@1) عبر أربع مجموعات بيانات مختلفة لاسترجاع غير مُدرّب مسبقاً (zero-shot retrieval)، مقارنةً بالخوارزمية الأصلية ProxyNCA. علاوة على ذلك، نحقق نتائج متقدمة على مستوى الدولة (state-of-the-art) على مجموعات بيانات CUB200 وCars196 وSop وInShop، حيث تصل قيم الاسترجاع عند الدرجة الأولى (Recall@1) إلى 72.2 و90.1 و81.4 و90.9 على التوالي.