DeFRCN: فك الارتباط بين أسرع R-CNN للكشف عن الأشياء بقليل من الصور

الكشف عن الأشياء بقليل من الأمثلة، والذي يهدف إلى اكتشاف أشياء جديدة بسرعة من أمثلة مُشَرَّحة قليلة جداً لفئات لم يتم رؤيتها من قبل، قد جذب اهتماماً بحثياً كبيراً في المجتمع العلمي. تعتمد معظم الطرق الحالية على إطار الكشف السريع R-CNN كإطار أساسي لاكتشاف الأشياء، ومع ذلك، بسبب نقص الاعتبارات المخصصة للسيناريوهات ذات البيانات النادرة، فإن أدائها غالباً ما يكون غير مرضٍ. في هذا البحث، نقوم بدراستنا الدقيقة لإطار الكشف السريع R-CNN التقليدي وتحليل تناقضاته من وجهتي نظر متعامدتان: متعددة المراحل (RPN مقابل RCNN) ومتعددة المهام (التصنيف مقابل التموضع). لحل هذه المشكلات، نقترح هندسة بسيطة ولكن فعالة تُسمى الكشف السريع R-CNN المنفصل (DeFRCN). بالتحديد، نوسع إطار الكشف السريع R-CNN بإدخال طبقة الفصل التدرجي للفصل متعدد المراحل ووحدة التعديل النموذجية للفصل متعدد المهام. الأولى هي طبقة عميقة جديدة تعيد تعريف عملية تقدم الخصائص وعملية العودة التدرجية لفصل الطبقة اللاحقة والطبقة السابقة، أما الثانية فهي نموذج تصنيف قائم على النماذج الأولية خارج الخط يأخذ مقترحات الكاشف كمدخل ويحسن النقاط الأصلية للتصنيف بنقاط زوجية إضافية للتعديل. تُظهر التجارب الواسعة على عدة مقاييس أن إطارنا هو أفضل بشكل ملحوظ من الأساليب الموجودة الأخرى ويحدد حالة جديدة رائدة في أدبيات القليل من الأمثلة.