التعلم الملتوي للكشف عن الأشياء برقابة ضعيفة

يتناول هذا البحث مشكلة الكشف عن الأشياء تحت الإشراف الضعيف باستخدام فقط إشراف على مستوى الصورة في مرحلة التدريب. تدربت النماذج السابقة على صور كاملة دفعة واحدة، مما جعلها عرضة للوقوع في نقاط مثلى فرعية بسبب الأمثلة الإيجابية الخاطئة المقدمة. بخلاف هذه النماذج، نقترح استراتيجية تعلم متعرجة للكشف عن حالات الأشياء الموثوقة بشكل متزامن ومنع النموذج من الانطباع الزائد على البذور الأولية. لتحقيق هذا الهدف، قمنا أولاً بتطوير معيار يُسمى درجات تراكم الطاقة المتوسطة (mEAS) لقياس وترتيب صعوبة تحديد موقع الصورة التي تحتوي على الكائن المستهدف بشكل آلي، ومن ثم تعلم النموذج بشكل تدريجي بتقديم أمثلة ذات صعوبة متزايدة. بهذه الطريقة، يمكن أن يكون النموذج مستعدًا بشكل أفضل من خلال التدريب على الأمثلة السهلة قبل التعلم من الأمثلة الأكثر صعوبة، وبالتالي يكتسب قدرة كشف أقوى بكفاءة أكبر. بالإضافة إلى ذلك، نقدم استراتيجية تنظيم جديدة باستخدام خرائط الميزات المتقدمة للتجعيد (Convolutional Feature Maps) لتجنب الانطباع الزائد على العينات الأولية. تشكل هذان الوحدان عملية تعلم متعرجة، حيث يعمل التعلم التدريجي على اكتشاف حالات الأشياء الموثوقة، بينما يزيد التنظيم بالقناع من صعوبة العثور على حالات الأشياء بشكل صحيح. حققنا نسبة دقة متوسطة (mAP) بلغت 47.6% على مجموعة بيانات PASCAL VOC 2007، مما يتفوق بشكل كبير على أفضل التقنيات الحالية في هذا المجال.