كشف الكائنات القائم على القليل من الأمثلة من خلال الانتباه إلى النموذج الفردي لكل عينة

يهدف الكشف عن الكائنات بعينات قليلة (Few-shot object detection) إلى اكتشاف حالات فئات محددة في صورة استعلام باستخدام عدد قليل جدًا من العينات الداعمة. وعلى الرغم من أن هذا يتطلب جهدًا أقل مقارنةً بجمع عدد كافٍ من الصور المُعلَّمة للكشف المُراقب عن الكائنات، إلا أنه يُنتج أداءً أضعف بكثير مقارنةً بالطرق التقليدية للكشف عن الكائنات. في هذا البحث، نقترح نهجًا يعتمد على التعلم التكراري (meta-learning) يأخذ بعين الاعتبار الخصائص الفريدة لكل عينة داعمة. بدلًا من تبسيط المعلومات من العينات الداعمة من خلال المتوسط لتكوين بروتوكول واحد لكل فئة، يمكن لطريقتنا الاستفادة بشكل أفضل من معلومات كل عينة داعمة من خلال اعتبار كل عينة داعمة كبروتوكول منفصل. وبشكل محدد، نُقدِّم نوعين من آليات الانتباه (attention mechanisms) لدمج خرائط الميزات الخاصة بالاستعلام والعينات الداعمة. الأول يتمثل في تحسين معلومات العينات القليلة من خلال استخلاص المعلومات المشتركة بين العينات الداعمة باستخدام الانتباه. والثاني يعتمد على استخدام كل عينة داعمة كرمز فئة (class code) للاستفادة من المعلومات من خلال مقارنة التشابه بين كل ميزة داعمة وميزة الاستعلام. تُعد الطريقة المقترحة مكملة للطرق السابقة، مما يجعل من السهل دمجها وتشغيلها لتحسين الأداء أكثر. وقد تم تقييم طريقتنا على معايير PASCAL VOC وCOCO، وقد أكدت النتائج فعالية طريقتنا. وبشكل خاص، تُظهر طريقة الاقتراح مزاياها القصوى عندما تكون هناك تنوع كبير بين بيانات العينات الداعمة.