إلى كاشفات كائنات قليلة الحالة أحادية المرحلة تمييزية وقابلة للتحويل

تتطلب النماذج الحديثة للكشف عن الكائنات كميات كبيرة من البيانات المُعلَّمة لتدريب فئات جديدة من الكائنات. يهدف الكشف عن الكائنات بعينة قليلة (FSOD) إلى معالجة هذه المشكلة من خلال تعلُّم فئات جديدة باستخدام عدد قليل جدًا من العينات. وعلى الرغم من تحقيق نتائج تنافسية باستخدام كاشفات FSOD ذات مرحلتين، إلا أن كاشفات FSOD ذات المرحلة الواحدة تُظهر عادةً أداءً أضعف مقارنةً بها. لاحظنا أن الفجوة الكبيرة في الأداء بين الكاشفات ذات المرحلتين والأحادية السبب الرئيسي يكمن في ضعف التمييز، وهو ما يُفسَّر بوجود مجال استقبال صغير بعد الدمج، وعدد قليل جدًا من العينات المُعلَّمة للخلفية في دالة الخسارة. ولمعالجة هذه القيود، نقترح نموذجًا يُسمى Few-shot RetinaNet (FSRN)، والذي يتضمن: استراتيجية تدريب متعددة الاتجاهات باستخدام العينات الداعمة لزيادة عدد العينات المُعلَّمة للخلفية الخاصة بالكاشفات الدقيقة (meta-detectors)؛ ودمج مبكر لمستويات متعددة من الميزات يوفر مجال استقبال واسع يغطي كامل منطقة المُعلِّق (anchor area)؛ بالإضافة إلى تقنيتين للتكبير تُطبَّقان على الصور الاستعلامية والصورة المصدرية لتعزيز قابلية الانتقال (transferability). أظهرت التجارب الواسعة أن النهج المقترح يعالج هذه القيود ويعزز كلاً من التمييز والقابلية للانتقال. ويتميز FSRN بسرعة تقارب ضعفي سرعة كاشفات FSOD ذات المرحلتين، مع الحفاظ على أداء تنافسي من حيث الدقة، كما يتفوَّق على أحدث النماذج ذات المرحلة الواحدة، وبعض النماذج ذات المرحلتين على معايير MS-COCO وPASCAL VOC.