إعادة تحسين العينات الإيجابية متعددة المقياس للكشف عن الكائنات القليلة التمثيل

كشف الكائنات بعينات قليلة (FSOD) يُمكّن النماذج من التكيّف مع فئات غير مرئية باستخدام عدد قليل من الأمثلة التدريبية، وهو أمر مفيد عندما تكون عملية التسمية اليدوية مكلفة زمنيًا أو عندما تكون عملية جمع البيانات محدودة. على عكس المحاولات السابقة التي استخدمت تقنيات الكشف عن الكائنات بعينات قليلة لتسهيل FSOD، يُبرز هذا العمل الحاجة إلى التعامل مع مشكلة التغيرات في الحجم، وهي مشكلة صعبة بسبب التوزيع الفريد للعينات. ولحل هذه المشكلة، نقترح منهجية تُسمى تحسين العينات الإيجابية متعددة المقاييس (MPSR)، والتي تُثري أطوال الكائنات في إطار FSOD. حيث تُولِّد هذه الطريقة عينات إيجابية متعددة المقاييس على شكل هرم كائني، وتحسّن التنبؤات على مقاييس مختلفة. ونُظهر فوائد هذا النهج من خلال دمجه كفرع مساعد في البنية الشهيرة لـ Faster R-CNN مع FPN، مما يُنتج حلًا قويًا للكشف عن الكائنات بعينات قليلة. أجرينا عدة تجارب على مجموعتي بيانات PASCAL VOC وMS COCO، وأظهر النهج المقترح نتائج متميزة على مستوى الحالة الحالية، وتفوق بشكل ملحوظ على البدائل الأخرى، مما يُثبت فعاليته. يمكن الوصول إلى الكود من خلال الرابط: https://github.com/jiaxi-wu/MPSR.