DETReg: التدريب المسبق غير المراقب مع أولويات المناطق للكشف عن الكائنات

تتركز الطرق الحديثة للتدريب المسبق ذاتيًا في كشف الكائنات بشكل كبير على تدريب النواة (backbone) لكاشف الكائنات، متجاهلة الأجزاء الأساسية في بنية كشف الكائنات. بدلًا من ذلك، نقدّم طريقة جديدة تُسمى DETReg، وهي طريقة ذاتية للتدريب المسبق تُدرّب الشبكة الكاملة لكاشف الكائنات، بما في ذلك مكونات تحديد موقع الكائنات وتمثيل الميزات (embedding). أثناء التدريب المسبق، تقوم DETReg باستنتاج مواقع الكائنات لتتطابق مع المواقع الناتجة عن مُولّد مقترحات مناطق غير مُشرَّفة، وفي الوقت نفسه، تُنسِّق تمثيلات الميزات المقابلة مع تمثيلات من مُشغّل صور ذاتي التدريب. قمنا بتنفيذ DETReg باستخدام عائلة كاشفات DETR، وأظهرنا أنها تتفوّق على النماذج التنافسية عند التخصيص الدقيق (fine-tuning) على مجموعات بيانات COCO وPASCAL VOC وAirbus Ship. كما حققت DETReg تحسينًا في الأداء في السيناريوهات ذات البيانات المحدودة، مثل التدريب باستخدام فقط 1% من العلامات، وفي سياقات التعلّم بعينات قليلة (few-shot learning).