HyperAIHyperAI

Command Palette

Search for a command to run...

إلى كاشفات كائنات قليلة الحالة أحادية المرحلة تمييزية وقابلة للتحويل

Karim Guirguis Mohamed Abdelsamad George Eskandar Ahmed Hendawy Matthias Kayser Bin Yang Juergen Beyerer

الملخص

تتطلب النماذج الحديثة للكشف عن الكائنات كميات كبيرة من البيانات المُعلَّمة لتدريب فئات جديدة من الكائنات. يهدف الكشف عن الكائنات بعينة قليلة (FSOD) إلى معالجة هذه المشكلة من خلال تعلُّم فئات جديدة باستخدام عدد قليل جدًا من العينات. وعلى الرغم من تحقيق نتائج تنافسية باستخدام كاشفات FSOD ذات مرحلتين، إلا أن كاشفات FSOD ذات المرحلة الواحدة تُظهر عادةً أداءً أضعف مقارنةً بها. لاحظنا أن الفجوة الكبيرة في الأداء بين الكاشفات ذات المرحلتين والأحادية السبب الرئيسي يكمن في ضعف التمييز، وهو ما يُفسَّر بوجود مجال استقبال صغير بعد الدمج، وعدد قليل جدًا من العينات المُعلَّمة للخلفية في دالة الخسارة. ولمعالجة هذه القيود، نقترح نموذجًا يُسمى Few-shot RetinaNet (FSRN)، والذي يتضمن: استراتيجية تدريب متعددة الاتجاهات باستخدام العينات الداعمة لزيادة عدد العينات المُعلَّمة للخلفية الخاصة بالكاشفات الدقيقة (meta-detectors)؛ ودمج مبكر لمستويات متعددة من الميزات يوفر مجال استقبال واسع يغطي كامل منطقة المُعلِّق (anchor area)؛ بالإضافة إلى تقنيتين للتكبير تُطبَّقان على الصور الاستعلامية والصورة المصدرية لتعزيز قابلية الانتقال (transferability). أظهرت التجارب الواسعة أن النهج المقترح يعالج هذه القيود ويعزز كلاً من التمييز والقابلية للانتقال. ويتميز FSRN بسرعة تقارب ضعفي سرعة كاشفات FSOD ذات المرحلتين، مع الحفاظ على أداء تنافسي من حيث الدقة، كما يتفوَّق على أحدث النماذج ذات المرحلة الواحدة، وبعض النماذج ذات المرحلتين على معايير MS-COCO وPASCAL VOC.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp