تكيف كاشفات المركبات للصور الجوية في مجالات غير مرئية باستخدام الإشراف الضعيف

كشف المركبات في الصور الجوية يُعد مهمة بالغة الأهمية، وتُستخدم في مجالات متنوعة تشمل مراقبة حركة المرور، والتخطيط الحضري، والاستخبارات الدفاعية. وقد قدمت الطرق القائمة على التعلم العميق نتائج متميزة (SOTA) في هذا المجال. ومع ذلك، يبرز تحدي كبير عندما تفشل النماذج المدربة على بيانات من منطقة جغرافية معينة في التعميم بكفاءة على مناطق أخرى. فالتغيرات في عوامل متعددة، مثل الظروف البيئية، والتخطيط الحضري، وشبكات الطرق، وأنواع المركبات، ومقاييس اكتساب الصور (مثل الدقة، والإضاءة، والزاوية)، تؤدي إلى ما يُعرف بـ"انزياح المجال" (domain shift)، مما يُضعف أداء النموذج. ويُقدّم هذا البحث منهجًا جديدًا يستخدم الذكاء الاصطناعي التوليدية لتوليد صور جوية عالية الجودة وملصقاتها المقابلة، بهدف تحسين تدريب كاشفات المركبات من خلال تعزيز البيانات. وتمثّل المساهمة الأساسية في هذا العمل تطوير إطار تنقل المعرفة متعدد المراحل ومتعدد الوسائط، يعتمد على نماذج التشتت في الفضاء الخفي المُعدّلة دقيقًا (LDMs)، لتقليل الفجوة في التوزيع بين البيئتين المصدرية والهدفية. وتشير التجارب الواسعة التي أُجريت عبر مجالات متعددة من الصور الجوية إلى تحسينات مستمرة في الأداء، حيث تتفوق النتائج على التعلم المراقب باستخدام بيانات البيئة المصدرية، وعلى أساليب التكيّف الضعيف، وعلى أساليب التكيّف غير المراقب للنطاق، وعلى كاشفات الكائنات المفتوحة المجال (open-set object detectors) بنسبة تتراوح بين 4% إلى 23%، و6% إلى 10%، و7% إلى 40%، وأكثر من 50% على التوالي. علاوةً على ذلك، نقدّم مجموعتين جديدتين من البيانات المُعلّمة بصور جوية من نيوزيلندا ويوتاه، لدعم الأبحاث المستقبلية في هذا المجال. يمكن الاطلاع على صفحة المشروع من خلال الرابط التالي: https://humansensinglab.github.io/AGenDA