HyperAIHyperAI
منذ 11 أيام

الانتباه المُدرِك المزدوج للكشف عن الكائنات بعينات قليلة

Tung-I Chen, Yueh-Cheng Liu, Hung-Ting Su, Yu-Cheng Chang, Yu-Hsiang Lin, Jia-Fong Yeh, Wen-Chin Chen, Winston H. Hsu
الانتباه المُدرِك المزدوج للكشف عن الكائنات بعينات قليلة
الملخص

رغم التقدم الأخير الذي عزز بشكل كبير أداء التصنيف بقليل من الأمثلة (FSC)، تظل مهمة كشف الكائنات بقليل من الأمثلة (FSOD) تحديًا كبيرًا للأنظمة الحديثة للتعلم. تعتمد الأنظمة الحالية للكشف عن الكائنات بقليل من الأمثلة على مناهج FSC، مع تجاهل قضايا حاسمة مثل التغير المكاني والتمثيلات غير المؤكدة، مما يؤدي إلى أداء منخفض. ونظرًا لهذا الوضع، نقترح آلية جديدة تُسمى الانتباه المزدوج الوعي (DAnA)، التي تتيح للشبكات تفسيرًا تكيفيًا للصور الداعمة المعطاة. تقوم DAnA بتحويل الصور الداعمة إلى ميزات مُتَعَلِّقة بموقع الاستعلام (QPA)، مما يوجه شبكات الكشف بدقة من خلال تخصيص معلومات داعمة مناسبة لكل منطقة محلية في الصورة الاستعلامية. علاوةً على ذلك، تُعد المكوّن المقترح DAnA مرنًا وقابلًا للتكيف مع عدة إطارات كشف كائنات موجودة مسبقًا. وباستخدام DAnA، تحقق شبكات الكشف التقليدية، مثل Faster R-CNN وRetinaNet، التي لم تُصمم خصيصًا للتعلم بقليل من الأمثلة، أداءً متفوقًا على أحدث النماذج في مهام FSOD. مقارنةً بالطرق السابقة، يرتفع أداء نموذجنا بشكل كبير بنسبة 47% (+6.9 AP)، مما يُظهر قدرة متميزة في مختلف إعدادات التقييم.

الانتباه المُدرِك المزدوج للكشف عن الكائنات بعينات قليلة | أحدث الأوراق البحثية | HyperAI