Command Palette
Search for a command to run...
إلى كاشفات كائنات قليلة الحالة أحادية المرحلة تمييزية وقابلة للتحويل
إلى كاشفات كائنات قليلة الحالة أحادية المرحلة تمييزية وقابلة للتحويل
Karim Guirguis Mohamed Abdelsamad George Eskandar Ahmed Hendawy Matthias Kayser Bin Yang Juergen Beyerer
الملخص
تتطلب النماذج الحديثة للكشف عن الكائنات كميات كبيرة من البيانات المُعلَّمة لتدريب فئات جديدة من الكائنات. يهدف الكشف عن الكائنات بعينة قليلة (FSOD) إلى معالجة هذه المشكلة من خلال تعلُّم فئات جديدة باستخدام عدد قليل جدًا من العينات. وعلى الرغم من تحقيق نتائج تنافسية باستخدام كاشفات FSOD ذات مرحلتين، إلا أن كاشفات FSOD ذات المرحلة الواحدة تُظهر عادةً أداءً أضعف مقارنةً بها. لاحظنا أن الفجوة الكبيرة في الأداء بين الكاشفات ذات المرحلتين والأحادية السبب الرئيسي يكمن في ضعف التمييز، وهو ما يُفسَّر بوجود مجال استقبال صغير بعد الدمج، وعدد قليل جدًا من العينات المُعلَّمة للخلفية في دالة الخسارة. ولمعالجة هذه القيود، نقترح نموذجًا يُسمى Few-shot RetinaNet (FSRN)، والذي يتضمن: استراتيجية تدريب متعددة الاتجاهات باستخدام العينات الداعمة لزيادة عدد العينات المُعلَّمة للخلفية الخاصة بالكاشفات الدقيقة (meta-detectors)؛ ودمج مبكر لمستويات متعددة من الميزات يوفر مجال استقبال واسع يغطي كامل منطقة المُعلِّق (anchor area)؛ بالإضافة إلى تقنيتين للتكبير تُطبَّقان على الصور الاستعلامية والصورة المصدرية لتعزيز قابلية الانتقال (transferability). أظهرت التجارب الواسعة أن النهج المقترح يعالج هذه القيود ويعزز كلاً من التمييز والقابلية للانتقال. ويتميز FSRN بسرعة تقارب ضعفي سرعة كاشفات FSOD ذات المرحلتين، مع الحفاظ على أداء تنافسي من حيث الدقة، كما يتفوَّق على أحدث النماذج ذات المرحلة الواحدة، وبعض النماذج ذات المرحلتين على معايير MS-COCO وPASCAL VOC.