ميتا-آر سي إن: التعلم الميتا للكشف عن الكائنات القليلة المعينة

على الرغم من التقدم الكبير في كشف الكائنات في السنوات الأخيرة، يظل تدريب كاشفات فعّالة في بيئة بيانات صغيرة تحديًا مفتوحًا. إن تسمية بيانات التدريب لكشف الكائنات أمر مكلف للغاية، وهناك حاجة إلى تطوير تقنيات قادرة على التعميم الجيد من كميات صغيرة من البيانات المُعلّمة. نستكشف هذه المشكلة المتمثلة في كشف الكائنات بعينات قليلة (few-shot object detection)، حيث يكون الكاشف متاحًا فقط لكميات محدودة من البيانات المُعلّمة. بالاعتماد على مبدأ التعلم التأملي (meta-learning) الذي يتطور حاليًا، نقترح إطارًا جديدًا للتعلم التأملي لكشف الكائنات يُسمى "Meta-RCNN"، والذي يتعلم القدرة على إجراء كشف كائنات بعينات قليلة من خلال التعلم التأملي. بشكل خاص، يتعلم Meta-RCNN كاشف كائنات ضمن نموذج تعلّم إبيزودي (episodic learning) على بيانات التدريب (التي تُعتبر "ميتا" في هذا السياق). يساعد هذا النموذج في اكتساب معرفة أولية (prior) تمكن Meta-RCNN من أداء كشف كائنات بعينات قليلة على مهام جديدة. مبنيًا على نموذج Faster RCNN، يُدرّس في Meta-RCNN كل من شبكة اقتراح المناطق (RPN) وفرع تصنيف الكائنات من خلال التعلم التأملي. يتعلم RPN المدرب تأمليًا تقديم اقتراحات محددة بالفئة، في حين يتعلم تصنيف الكائنات إجراء التصنيف بعينات قليلة. يمكن تدريب الأهداف الوظيفية الجديدة واستراتيجية التعلم في Meta-RCNN بطريقة متكاملة (end-to-end). وقد أظهرنا فعالية Meta-RCNN في معالجة مشكلة الكشف بعينات قليلة على مجموعة بيانات Pascal VOC، وحقق نتائج واعدة.