تحسين التدريب للكشف عن الكائنات القائم على الاستعلام من خلال استرجاع الاستعلامات المختارة

يدرس هذا البحث fenomenon يُعرف بحدوث أخطاء في التنبؤ بواسطة كاشفات الكائنات القائمة على الاستعلام (query-based object detectors) في المرحلة النهائية من عملية التفكيك (decoding)، رغم التنبؤ الصحيح في مراحل وسيطة. نراجع عملية التدريب ونُرجع الظاهرة المُهملة إلى قَعْدَين رئيسيين: نقص التركيز أثناء التدريب، وتكاثر الأخطاء الناتجة عن التسلسل التفكيكي. نصمم ونقدم استراتيجية تدريب بسيطة وفعّالة تُسمى "استرجاع الاستعلامات المُختارة" (Selective Query Recollection - SQR) لكاشفات الكائنات القائمة على الاستعلام. تجمع SQR بشكل تراكمي الاستعلامات الوسيطة أثناء تعمق المراحل التفكيكية، وترسل بشكل مختار هذه الاستعلامات إلى المراحل التالية دون الالتزام بالهيكل التسلسلي التقليدي. وبهذا، تُركّز SQR التدريب على المراحل اللاحقة، وتمكّن هذه المراحل من العمل مباشرةً مع الاستعلامات الوسيطة من المراحل السابقة. يمكن دمج SQR بسهولة في مختلف كاشفات الكائنات القائمة على الاستعلام، وتعزز أداءها بشكل ملحوظ دون تغيير مسار الاستنتاج (inference pipeline). كنتيجة لذلك، طبّقنا SQR على نماذج Adamixer وDAB-DETR وDeformable-DETR في مختلف الإعدادات (الهيكل الأساسي، عدد الاستعلامات، جدول التدريب)، وحققت بشكل متسق تحسينًا في دقة التقييم (AP) يتراوح بين 1.4 إلى 2.8 نقطة.