ميتا-ديتر: الكشف عن الكائنات قليلة الأمثلة على مستوى الصورة باستخدام استغلال الارتباطات بين الفئات

تم دراسة كشف الكائنات ذات العينات القليلة بشكل واسع من خلال دمج التعلم المتعدد (meta-learning) في أطر الكشف القائمة على المناطق. وعلى الرغم من نجاح هذا النموذج، إلا أنه يعاني من عدة قيود، مثل (أ) اقتراحات مناطق منخفضة الجودة للفئات الجديدة، و(ب) إهمال الارتباط بين الفئات المختلفة. تؤدي هذه القيود إلى تقييد قدرة نقل المعرفة من الفئات الأساسية إلى كشف الكائنات الفئات الجديدة. في هذا العمل، نصمم Meta-DETR، وهي إطار جديد لكشف الكائنات ذات العينات القليلة، يدمج تجميع الارتباطات (correlational aggregation) في التعلم المتعدد ضمن أطر الكشف DETR. يعمل Meta-DETR بالكامل على مستوى الصورة دون الحاجة إلى أي اقتراحات مناطق، مما يتجنب القيود الناتجة عن اقتراحات غير دقيقة في الأطر الشائعة لكشف الكائنات ذات العينات القليلة. علاوةً على ذلك، يمكن لـ Meta-DETR التوجه إلى عدة فئات داعمة في نفس الوقت ضمن عملية تغذية أمامية واحدة. ويُعد هذا التصميم الفريد قادراً على التقاط الارتباط بين الفئات المختلفة، مما يقلل بشكل كبير من خطأ التصنيف بين الفئات المشابهة ويعزز نقل المعرفة إلى الفئات الجديدة. أظهرت التجارب على عدة معايير للكشف عن الكائنات ذات العينات القليلة أن Meta-DETR يتفوق على أحدث الطرق بفارق كبير. سيتم إصدار رموز التنفيذ على الرابط: https://github.com/ZhangGongjie/Meta-DETR.