HyperAIHyperAI
منذ 11 أيام

إلى كاشفات كائنات قليلة الحالة أحادية المرحلة تمييزية وقابلة للتحويل

Karim Guirguis, Mohamed Abdelsamad, George Eskandar, Ahmed Hendawy, Matthias Kayser, Bin Yang, Juergen Beyerer
إلى كاشفات كائنات قليلة الحالة أحادية المرحلة تمييزية وقابلة للتحويل
الملخص

تتطلب النماذج الحديثة للكشف عن الكائنات كميات كبيرة من البيانات المُعلَّمة لتدريب فئات جديدة من الكائنات. يهدف الكشف عن الكائنات بعينة قليلة (FSOD) إلى معالجة هذه المشكلة من خلال تعلُّم فئات جديدة باستخدام عدد قليل جدًا من العينات. وعلى الرغم من تحقيق نتائج تنافسية باستخدام كاشفات FSOD ذات مرحلتين، إلا أن كاشفات FSOD ذات المرحلة الواحدة تُظهر عادةً أداءً أضعف مقارنةً بها. لاحظنا أن الفجوة الكبيرة في الأداء بين الكاشفات ذات المرحلتين والأحادية السبب الرئيسي يكمن في ضعف التمييز، وهو ما يُفسَّر بوجود مجال استقبال صغير بعد الدمج، وعدد قليل جدًا من العينات المُعلَّمة للخلفية في دالة الخسارة. ولمعالجة هذه القيود، نقترح نموذجًا يُسمى Few-shot RetinaNet (FSRN)، والذي يتضمن: استراتيجية تدريب متعددة الاتجاهات باستخدام العينات الداعمة لزيادة عدد العينات المُعلَّمة للخلفية الخاصة بالكاشفات الدقيقة (meta-detectors)؛ ودمج مبكر لمستويات متعددة من الميزات يوفر مجال استقبال واسع يغطي كامل منطقة المُعلِّق (anchor area)؛ بالإضافة إلى تقنيتين للتكبير تُطبَّقان على الصور الاستعلامية والصورة المصدرية لتعزيز قابلية الانتقال (transferability). أظهرت التجارب الواسعة أن النهج المقترح يعالج هذه القيود ويعزز كلاً من التمييز والقابلية للانتقال. ويتميز FSRN بسرعة تقارب ضعفي سرعة كاشفات FSOD ذات المرحلتين، مع الحفاظ على أداء تنافسي من حيث الدقة، كما يتفوَّق على أحدث النماذج ذات المرحلة الواحدة، وبعض النماذج ذات المرحلتين على معايير MS-COCO وPASCAL VOC.

إلى كاشفات كائنات قليلة الحالة أحادية المرحلة تمييزية وقابلة للتحويل | أحدث الأوراق البحثية | HyperAI