مسافة واسيرستاين الغاوسية القياسية للكشف عن الأجسام الصغيرة

كشف الكائنات الصغيرة يُعد مشكلة صعبة للغاية، نظرًا لأن الكائن الصغير يحتوي فقط على عدد قليل من البكسلات في الحجم. نُظهر أن كاشفات الحالة الراهنة لا تُنتج نتائج مرضية في الكائنات الصغيرة بسبب نقص المعلومات البصرية. ملاحظتنا الأساسية هي أن مقاييس تعتمد على معامل التقاطع على الاتحاد (IoU)، مثل IoU نفسه وتمديداته، حساسة جدًا لانحراف الموضع في الكائنات الصغيرة، وتؤدي إلى تدهور حاد في أداء الكشف عند استخدامها في كاشفات تعتمد على المحددات (anchor-based detectors). لتحسين هذا الوضع، نقترح معيار تقييم جديد يستخدم مسافة واسيرشتين (Wasserstein distance) للكشف عن الكائنات الصغيرة. بشكل خاص، نُمَثِّل مربعات الحدود (bounding boxes) كتوزيعات غاوسية ثنائية الأبعاد، ثم نُقدِّم معيارًا جديدًا يُسمى المسافة واسيرشتين المُعيَّنة (Normalized Wasserstein Distance - NWD) لحساب التشابه بينها من خلال التوزيعات الغاوسية المقابلة. يمكن دمج معيار NWD المقترح بسهولة في عملية التعيين (assignment)، وتمييز الحد الأقصى غير المُتداخل (non-maximum suppression)، ووظيفة الخسارة (loss function) لأي كاشف يعتمد على المحددات، لاستبدال معيار IoU الشائع الاستخدام. قمنا بتقييم معيارنا على مجموعة بيانات جديدة للكشف عن الكائنات الصغيرة (AI-TOD)، حيث يكون متوسط حجم الكائنات أصغر بكثير من مجموعات بيانات الكشف عن الكائنات الموجودة مسبقًا. أظهرت التجارب الواسعة أن استخدام معيار NWD يُحسِّن الأداء بمقدار 6.7 نقطة في مقياس AP مقارنةً بأساس التحسين الدقيق القياسي (standard fine-tuning baseline)، و6.0 نقاط أعلى من أقوى المنافسين الحاليين. يمكن الوصول إلى الكود من خلال: https://github.com/jwwangchn/NWD.