CFA: نهج التدريب المخصص القائم على القيود للكشف العام عن الكائنات في حالات قليلة من الأمثلة

يهدف الكشف عن الكائنات بقليل من الأمثلة (FSOD) إلى اكتشاف فئات جديدة باستخدام كميات محدودة من البيانات من خلال الاستفادة من المعرفة السابقة المستمدة من بيانات أساسية غنية. يسعى الكشف عن الكائنات بقليل من الأمثلة المعمم (G-FSOD) إلى معالجة مشكلة FSOD دون نسيان الفئات الأساسية التي تم رؤيتها سابقًا، وبالتالي يُعدّ سيناريوًا أكثر واقعية، حيث تُواجه كلتا الفئتين أثناء مرحلة الاختبار. وعلى الرغم من أن الطرق الحالية لـ FSOD تعاني من نسيان كارثي، فإن G-FSOD يعالج هذه المشكلة، لكنه يُظهر انخفاضًا في الأداء على المهام الجديدة مقارنة بأفضل الطرق الحالية لـ FSOD. في هذا العمل، نقترح نهجًا مُحدَّدًا للتعديل الدقيق (CFA) لتخفيف ظاهرة النسيان الكارثي، مع تحقيق نتائج تنافسية على المهام الجديدة دون زيادة في سعة النموذج. يُطبّق CFA طريقة تعلم مستمر، تُعرف بذاكرة التكرار المتوسطة للGradient (A-GEM)، على سياق G-FSOD. وبشكل خاص، يُفرض عدد أكبر من القيود على استراتيجية البحث عن المُشتقة (الجرينت)، مما يؤدي إلى استخلاص قاعدة تحديث مُشتقة جديدة، تُمكّن من تبادل أفضل للمعرفة بين الفئات الأساسية والجديدة. ولتقييم طريقة العمل، أجرينا تجارب واسعة على مجموعتي بيانات MS-COCO وPASCAL-VOC. وقد أظهرت النتائج أن طريقة CFA تتفوّق على الطرق الحالية لـ FSOD وG-FSOD في المهام الجديدة، مع حدوث انخفاض طفيف في الأداء على المهام الأساسية. علاوةً على ذلك، فإن CFA متعامدة مع الطرق الحالية لـ FSOD، وتعمل كوحدة قابلة للتركيب والتشغيل (plug-and-play) دون زيادة في سعة النموذج أو زمن الاستدلال.