إعادة تحسين المANCHOR من خلال التفاعل النموذجي للكشف الكفؤ عن الكائنات في الصور الجوية

لقد حققت كشف الكائنات تقدماً هائلاً في رؤية الحاسوب. يُعد كشف الكائنات الصغيرة مع تدهور في المظهر أحد التحديات البارزة، خصوصاً في الملاحظات الجوية. ولجمع عينات إيجابية/سلبية كافية لتدريب خوارزميات استنتاجية، يُحدِّد معظم مُكتشفات الكائنات مسبقاً مساحات مُحاصرة (anchors) لحساب معامل التقاطع على التداخل (IoU) مقابل البيانات الحقيقية (ground-truth). وفي هذه الحالة، تُهمل الكائنات الصغيرة غالباً أو تُصنف خطأً. في هذا البحث، نقدّم شبكة فعّالة تُسمّى DEA (Dynamic Enhancement Anchor) لبناء مُولّد جديد للعينات التدريبية. على عكس التقنيات الرائدة الأخرى، تُوظّف الشبكة المقترحة مُصنّفاً للعينات (sample discriminator) لتحقيق عملية تصفية تفاعلية للعينات بين وحدة تعتمد على المساحات المحصورة (anchor-based) ووحدة لا تعتمد عليها (anchor-free)، بهدف إنتاج عينات مناسبة. علاوة على ذلك، يُحسّن التدريب المشترك متعدد المهام مع خطة استنتاجية مبنية على مساحات مُحاصرة مُعتدلة الأداء من الشبكة المقترحة، مع تقليل التعقيد الحسابي. يدعم النهج المقترح كلاً من مهام كشف الكائنات المُوجّهة والكائنات الأفقية. تُظهر التجارب الواسعة على معيارين جويين صعبين (أي DOTA وHRSC2016) أن طريقةنا تحقق أداءً متفوّقاً من حيث الدقة، مع سرعة استنتاج معتدلة وعبء حسابي منخفض نسبياً أثناء التدريب. على معيار DOTA، تتفوّق شبكة DEA-Net التي تم دمجها مع الأساس (baseline) المبني على RoI-Transformer على الطريقة المتقدمة بـ 0.40% من متوسط دقة التقييم (mAP) في كشف الكائنات المُوجّهة، باستخدام شبكة أساسية أضعف (ResNet-101 مقابل ResNet-152)، وبنسبة 3.08% في كشف الكائنات الأفقية باستخدام نفس الشبكة الأساسية. بالإضافة إلى ذلك، تحقق شبكة DEA-Net المدمجة مع الأساس المبني على ReDet أداءً رائداً بـ 80.37%. أما على معيار HRSC2016، فقد تفوّقت على أفضل نموذج سابق بنسبة 1.1% باستخدام فقط 3 مساحات مُحاصرة أفقية.