دقة متوسطة قوية وقابلة للتحليل لاسترجاع الصور

في استرجاع الصور، تعتمد المقاييس القياسية لتقييم الأداء على ترتيب الدرجات، مثل الدقة المتوسطة (AP). في هذه الورقة، نقدّم طريقة جديدة تُسمى "مُسارات الدقة المتوسطة القابلة للثبات والتحليل" (ROADMAP)، والتي تعالج تحديين رئيسيين في التدريب من الطرف إلى الطرف للشبكات العصبية العميقة باستخدام AP: عدم القابلية للتفاضل وعدم القابلية للتحليل. أولاً، نقترح تقريبًا جديدًا قابلاً للتفاضل لدالة الترتيب، والذي يوفر حدًا علويًا لخسارة AP ويضمن تدريبًا قويًا. ثانيًا، نصمم دالة خسارة بسيطة ولكنها فعالة لتقليل فجوة القابلية للتحليل بين قيمة AP في المجموعة الكاملة للتدريب وتقريبها المُتوسّط للدفعة (batch)، مع تقديم ضمانات نظرية لهذا التحسين. أظهرت تجارب واسعة أجريت على ثلاث مجموعات بيانات لاسترجاع الصور أن ROADMAP تتفوق على عدة طرق حديثة لتقريب AP، وتُبرز أهمية مساهمتينا الرئيسيتين. وأخيرًا، باستخدام ROADMAP لتدريب النماذج العميقة، تم تحقيق أداء ممتاز، يتفوق على النتائج القياسية المتطورة في الثلاث مجموعات البيانات.