مُكتشف مُتسلسل للتكبير المُتزايد للصور الجوية عالية الدقة

كشف الكائنات في الصور الجوية يُعدّ تحديًا كبيرًا نظرًا لكونها عادةً تتكون من كائنات صغيرة متداخلة بشكل كثيف وتوزع بشكل غير منتظم في صور عالية الدقة. يُعدّ تقنية "القطع حسب الكثافة" (Density Cropping) من الأساليب الشائعة لتحسين كشف الكائنات الصغيرة، حيث يتم استخراج المناطق المكتظة بالكائنات الصغيرة ومعالجتها بدقة عالية. ومع ذلك، يتم عادةً تحقيق ذلك من خلال إضافة مكونات قابلة للتعلم، مما يُعقّد عملية التدريب والاستنتاج بالنسبة للعملية القياسية للكشف. في هذه الورقة، نقترح كاشفًا فعّالًا مُتسلسلًا يُسمى "Cascaded Zoom-in (CZ)"، والذي يُعيد توظيف الكاشف نفسه لدعم التدريب والاستنتاج الموجهين بالكثافة. أثناء التدريب، يتم تحديد القطع الكثيفة، وتُعلّم كفئة جديدة، وتُستخدم لتعزيز مجموعة التدريب. أثناء الاستنتاج، تُكشف هذه القطع الكثيفة أولًا مع الكائنات الأساسية، ثم تُدخل في مرحلة ثانية من الاستنتاج. يتميز هذا النهج بسهولة دمجه في أي كاشف، دون إحداث تغييرات كبيرة في العملية القياسية للكشف، على عكس النهج الشائع المتمثل في القطع الموحد (Uniform Cropping) في كشف الصور الجوية. وقد أكدت النتائج التجريبية على صور جوية من مجموعتي بيانات الصعبة VisDrone وDOTA فوائد النهج المقترح. كما يُحقق الكاشف CZ نتائج منافسة على مستوى الحد الأقصى في الأداء (state-of-the-art) مقارنةً بالقطع الموحد والطرق الأخرى للقطع حسب الكثافة على مجموعة بيانات VisDrone، حيث زاد متوسط دقة الكشف (mAP) للكائنات الصغيرة بأكثر من 3 نقاط.