HyperAIHyperAI
منذ 17 أيام

دقة متوسطة قوية وقابلة للتحليل لاسترجاع الصور

Elias Ramzi, Nicolas Thome, Clément Rambour, Nicolas Audebert, Xavier Bitot
دقة متوسطة قوية وقابلة للتحليل لاسترجاع الصور
الملخص

في استرجاع الصور، تعتمد المقاييس القياسية لتقييم الأداء على ترتيب الدرجات، مثل الدقة المتوسطة (AP). في هذه الورقة، نقدّم طريقة جديدة تُسمى "مُسارات الدقة المتوسطة القابلة للثبات والتحليل" (ROADMAP)، والتي تعالج تحديين رئيسيين في التدريب من الطرف إلى الطرف للشبكات العصبية العميقة باستخدام AP: عدم القابلية للتفاضل وعدم القابلية للتحليل. أولاً، نقترح تقريبًا جديدًا قابلاً للتفاضل لدالة الترتيب، والذي يوفر حدًا علويًا لخسارة AP ويضمن تدريبًا قويًا. ثانيًا، نصمم دالة خسارة بسيطة ولكنها فعالة لتقليل فجوة القابلية للتحليل بين قيمة AP في المجموعة الكاملة للتدريب وتقريبها المُتوسّط للدفعة (batch)، مع تقديم ضمانات نظرية لهذا التحسين. أظهرت تجارب واسعة أجريت على ثلاث مجموعات بيانات لاسترجاع الصور أن ROADMAP تتفوق على عدة طرق حديثة لتقريب AP، وتُبرز أهمية مساهمتينا الرئيسيتين. وأخيرًا، باستخدام ROADMAP لتدريب النماذج العميقة، تم تحقيق أداء ممتاز، يتفوق على النتائج القياسية المتطورة في الثلاث مجموعات البيانات.

دقة متوسطة قوية وقابلة للتحليل لاسترجاع الصور | أحدث الأوراق البحثية | HyperAI