Cascade R-CNN: استكشاف الكشف عن الأشياء بجودة عالية

في مجال اكتشاف الأشياء، يتطلب حد عتبة تقاطع على الاتحاد (Intersection over Union - IoU) لتحديد الإيجابيات والسلبيات. غالبًا ما تنتج أجهزة اكتشاف الأشياء التي تم تدريبها بحد عتبة IoU منخفض، مثل 0.5، اكتشافات ضوضائية. ومع ذلك، فإن أداء الاكتشاف يميل إلى التدهور مع زيادة حدود العتبة IoU. هناك عاملان رئيسيان مسؤولان عن هذا: 1) الانطباع الزائد خلال التدريب بسبب انخفاض الأمثلة الإيجابية بشكل أساسي، و2) عدم التطابق بين IoUs التي تكون فيها جهاز الاكتشاف مثلى وتلك الخاصة بالفرضيات المدخلة في وقت الاستدلال.لحل هذه المشاكل، تم اقتراح هندسة متعددة المراحل لاكتشاف الأشياء تُعرف باسم Cascade R-CNN. تتكون هذه الهندسة من سلسلة من الكاشفات التي يتم تدريبها بحدود عتبة IoU متزايدة، مما يجعلها أكثر تحديدًا ضد الإيجابيات الخاطئة القريبة بشكل تدريجي. يتم تدريب الكاشفات مرحلة بعد أخرى، مستفيدة من الملاحظة أن إخراج كاشف يمكن أن يكون توزيعًا جيدًا لتدريب الكاشف التالي ذي الجودة الأعلى. يضمن إعادة العينات للفرضيات المتقدمة تدريجيًا أن جميع الكاشفات لديها مجموعة أمثلة إيجابية متكافئة الحجم، مما يقلل من مشكلة الانطباع الزائد.أظهرت تنفيذ بسيط لـ Cascade R-CNN أنه يتفوق على جميع أجهزة اكتشاف الأشياء المنفردة في مجموعة بيانات COCO الصعبة. كما أظهرت التجارب أن Cascade R-CNN قابل للتطبيق على نطاق واسع عبر هياكل الكاشفات المختلفة، حيث حقق مكاسب ثابتة بغض النظر عن قوة كاشف الأساس. سيتم توفير الرمز المصدر في https://github.com/zhaoweicai/cascade-rcnn.