R-FCN: اكتشاف الأشياء عبر شبكات التحويل الكاملة القائمة على المناطق

نقدم شبكات عصبية اقليمية بالكامل ومتكررة للكشف عن الأشياء بدقة وكفاءة عالية. على عكس الكاشفات الإقليمية السابقة مثل Fast/Faster R-CNN التي تطبق شبكة فرعية مكلفة لكل منطقة بمئات المرات، فإن كاشفنا الإقليمي هو بالكامل متكرر مع تقاسم معظم الحسابات على الصورة بأكملها. لتحقيق هذا الهدف، نقترح خرائط النقاط الحساسة للموقع لحل المأزق بين ثبات الترجمة في تصنيف الصور والاختلاف في الترجمة عند الكشف عن الأشياء. يمكن لطريقتنا بالتالي أن تتبنى بشكل طبيعي نوى تصنيف الصور المتكررة بالكامل، مثل أحدث شبكات البقايا (ResNets)، للكشف عن الأشياء. نظهر نتائج تنافسية على مجموعات بيانات PASCAL VOC (مثلاً، 83.6% mAP على مجموعة البيانات لعام 2007) باستخدام شبكة ResNet ذات 101 طبقة. وفي الوقت نفسه، يتم تحقيق النتيجة بسرعة اختبار تبلغ 170 مللي ثانية لكل صورة، وهي أسرع بمقدار 2.5-20 مرة من طريقة Faster R-CNN المكافئة. تم جعل الرمز البرمجي متاحًا للعموم في: https://github.com/daijifeng001/r-fcn