الاهتمام القائم على التجميع لتعلم القياس العميق

يهدف التعلم القياسي العميق (Deep Metric Learning) إلى تعلم دالة تمثيلية مُنمذجة كشبكة عصبية عميقة. تضع هذه الدالة العناصر المرئية ذات الدلالة المتشابهة بالقرب من بعضها البعض بينما تباعد العناصر غير المتشابهة في الفضاء التمثيلي الذي يتم تعلمه. مؤخرًا، تم تطبيق التقنيات الجماعية (Ensemble) على التعلم القياسي العميق لتحقيق نتائج رائدة. كواحدة من الجوانب الهامة للتقنيات الجماعية، يجب أن تكون النماذج متنوعة في تمثيلاتها للخصائص. لذا، نقترح تقنية جماعية تعتمد على الانتباه (Attention-Based Ensemble)، والتي تستعمل أقنعة انتباه متعددة بحيث يمكن لكل نموذج التركيز على أجزاء مختلفة من الكائن. كما نقترح خسارة الاختلاف (Divergence Loss)، التي تشجع التنوع بين النماذج. تم تطبيق الطريقة المقترحة على مقاييس المعايير القياسية للتعلم القياسي العميق، وأظهرت النتائج التجريبية أنها تتفوق بشكل كبير على الأساليب الرائدة في مهام استرجاع الصور.