كشف الكائنات الصغيرة من خلال توليد اقتراحات من الخشنة إلى الدقيقة والتعلم بالتقمص

شهدت السنوات القليلة الماضية نجاحًا كبيرًا في مجال كشف الكائنات، إلا أن الكواشف المتطورة حاليًا تواجه صعوبات في التعامل مع الكائنات ذات الحجم المحدود. وبشكل محدد، يُعد التحدي الشهير الناتج عن التداخل المنخفض بين المعايير (priors) ومناطق الكائنات سببًا في تقييد عدد العينات المتاحة للتحسين، كما أن نقص المعلومات التمييزية يُفاقم من صعوبة التعرف على هذه الكائنات. ولتخفيف هذه المشكلات، نقترح CFINet، وهي إطار ثنائي المراحل مُصمم خصيصًا لكشف الكائنات الصغيرة، ويعتمد على نموذج التدرج من الخشونة إلى الدقة (Coarse-to-fine) وتعلم المحاكاة المميزة للسمات (Feature Imitation learning). أولاً، نُقدّم RPN من النوع التدرجي من الخشونة إلى الدقة (CRPN)، الذي يضمن توليد اقتراحات كافية وعالية الجودة للكائنات الصغيرة من خلال استراتيجية اختيار المعايير الديناميكية وانحدار متسلسل. ثانيًا، نزود وحدة الكشف التقليدية بفرع مُحاكاة السمات (FI)، لمساعدة النماذج على تمثيل المناطق الخاصة بالكائنات ذات الحجم المحدود، والتي تُربك النموذج عادةً، وذلك بطريقة محاكاة. علاوة على ذلك، تم تصميم خسارة مساعدة للمحاكاة تعتمد على نموذج التعلم المُراقب القائم على التباين (supervised contrastive learning)، بهدف تحسين هذا الفرع. عند دمج CFINet مع Faster RCNN، حقق الأداء المتميز على مجموعتي بيانات كبيرة لكشف الكائنات الصغيرة، SODA-D وSODA-A، مما يُبرز تفوقه على النموذج الأساسي وأساليب الكشف الشائعة الأخرى.