الغرس العميق المتدرج مع الوعي بالجهاز

في ظل التقدم المحرز في شبكات العصبونات العميقة، حققت تعلم المقاييس العميق نتائج واعدة في مهام مختلفة باستخدام شبكة الثلاثيات (Triplet Network) أو شبكة التوائم (Siamese Network). رغم أن الهدف الأساسي وهو جعل الصور من نفس الفئة أقرب إلى بعضها البعض أكثر من الصور من فئات مختلفة يبدو بديهيًا، إلا أنه من الصعب تحسينه مباشرة بسبب حجم العينة التربيعي أو المكعّب. لحل هذه المشكلة، يتم استخدام تعدين الأمثلة الصعبة بشكل واسع، والذي يركز فقط على مجموعة فرعية من العينات التي تعتبر صعبة. ومع ذلك، فإن "الصعوبة" تُعرَّف نسبيًا بالنسبة للنموذج، حيث يعتبر النماذج المعقدة معظم العينات سهلة والعكس صحيح بالنسبة للنماذج البسيطة، وكلاهما ليس جيدًا للتدريب. كما أن العينات لها مستويات صعوبة مختلفة، مما يجعل من الصعب تعريف نموذج ذو التعقيد المناسب واختيار الأمثلة الصعبة بشكل كافٍ. هذا ما دفعنا إلى الجمع بين مجموعة من النماذج ذات التعقيدات المختلفة بطريقة متسلسلة واستخراج الأمثلة الصعبة بشكل متكيف، حيث يتم الحكم على عينة بواسطة سلسلة من النماذج ذات التعقيد المتزايد ويتم تحديث النماذج فقط إذا اعتبرت العينة حالة صعبة. قمنا بتقييم طريقة عملنا على مجموعات البيانات CARS196 وCUB-200-2011 وStanford Online Products وVehicleID وDeepFashion. وقد أظهرت طريقة عملنا تفوقًا كبيرًا على أفضل الطرق الحالية.