Mask R-CNN

نقدم إطارًا مفهوميًا بسيطًا ومرنًا وشاملًا لفصل الكائنات في الصور. يكتشف هذا الإطار الكائنات في الصورة بكفاءة عالية مع إنتاج قناع تقطيع عالي الجودة لكل حالة. تُعرف هذه الطريقة باسم Mask R-CNN، وهي تمتد من إطار Faster R-CNN بإضافة فرع لتنبؤ القناع إلى جانب الفرع الموجود لتحديد الحدود المحيطة بالكائنات. يتميز Mask R-CNN بسهولة التدريب وإضافة تكلفة حسابية صغيرة فقط إلى Faster R-CNN، مما يسمح له بالعمل بمعدل 5 صورة في الثانية. بالإضافة إلى ذلك، يمكن تعميم Mask R-CNN بسهولة على مهام أخرى، مثل تقدير وضعيات الإنسان ضمن نفس الإطار. نعرض أفضل النتائج في جميع المسارات الثلاثة لتحديات COCO، بما في ذلك فصل الكائنات، اكتشاف الكائنات داخل حدودها المحددة، وتحديد نقاط المفتاح للإنسان. بدون أي تعديلات أو تحسينات إضافية، يتفوق Mask R-CNN على جميع النماذج المنفردة الموجودة في كل مهمة، بما في ذلك الفائزين بتحدي COCO 2016. نأمل أن يكون نهجنا البسيط والفعال نقطة انطلاق متينة وتيسّر البحث المستقبلي في مجال التعرف على الحالات.الكود متاح على الرابط التالي: https://github.com/facebookresearch/Detectron