تدريب مكتشفات الأشياء القائمة على المناطق باستخدام التنقيب عن الأمثلة الصعبة عبر الإنترنت

حققت مجال اكتشاف الأشياء تقدمًا كبيرًا بفضل الموجة التي أثارتها شبكات النيورونات القائمة على المناطق (Region-based ConvNets)، ولكن عملية تدريبها لا تزال تتضمن العديد من الأساليب التجريبية والمعامِلات الفائقة (hyperparameters) التي تكون مكلفة للضبط. نقدم في هذا البحث خوارزمية بسيطة ومع ذلك فعّالة بشكل مفاجئ لتعدين الأمثلة الصعبة عبر الإنترنت (Online Hard Example Mining - OHEM) لتدريب كاشفات شبكات النيورونات القائمة على المناطق. دوافعنا هي نفسها دائمًا -- مجموعات البيانات الخاصة باكتشاف الأشياء تحتوي على عدد ضخم من الأمثلة السهلة وعدد قليل من الأمثلة الصعبة. يمكن أن يجعل الاختيار التلقائي لهذه الأمثلة الصعبة عملية التدريب أكثر فعالية وكفاءة. يعتبر OHEM خوارزمية بسيطة وبديهية تقضي على العديد من الأساليب التجريبية والمعامِلات الفائقة المستخدمة بشكل شائع. ولكن ما هو أهم، أنه يحقق زيادة مستقرة وملحوظة في أداء اكتشاف الأشياء في مقاييس مثل PASCAL VOC 2007 و 2012. يزداد فعاليته مع زيادة حجم ومدى صعوبة مجموعات البيانات، كما أظهرت النتائج على مجموعة بيانات MS COCO. بالإضافة إلى ذلك، عند الجمع بينه وبين التطورات المكملة في المجال، يؤدي OHEM إلى أفضل النتائج المسجلة بنسبة 78.9% و 76.3% mAP على PASCAL VOC 2007 و 2012 على التوالي.