التصنيف المستوي للبكسل في الصور الجوية

يمكن استخدام الصور الجوية لأغراض مهمة على المستوى العالمي. ومع ذلك، فإن تحليل هذه البيانات باستخدام هياكل الشبكات العصبية الاصطناعية يتأخر عن الحالة المتطورة الحالية على مجموعات البيانات الشهيرة مثل PASCAL VOC وCityScapes وCamvid. في هذه الورقة، نقوم بسد الفجوة في الأداء بين هذه المجموعات الشهيرة وبيانات الصور الجوية. لا تُجرى سوى أعمال قليلة على الصور الجوية باستخدام هياكل الشبكات العصبية الاصطناعية المتطورة في سياق تصنيف متعدد الفئات. توفر تجاربنا المتعلقة بتوسيع البيانات، والتوحيد (التعويض)، وحجم الصورة، ووظائف الخسارة رؤى حول الإعداد الأمثل لتحقيق أداء عالٍ على مجموعات بيانات تقسيم الصور الجوية. وباستخدام بنية DeepLabv3+ Xception65 المتطورة، نحقق متوسط مقياس التداخل بين التوقعات والحقائق (mean IOU) بنسبة 70% على مجموعة التحقق من DroneDeploy. وبهذا الناتج، نتفوق بوضوح على أفضل أداء متوفر حاليًا على مجموعة التحقق (متوسط IOU 65%) بمقدار 5%. علاوة على ذلك، وبما أننا لا نعرف وجود معيار مسبق (benchmark) لـ mIOU على مجموعة الاختبار، نقترح بدورنا معيارًا جديدًا على مجموعة اختبار DroneDeploy باستخدام أفضل بنية أداءً من DeepLabv3+ Xception65، حيث نحقق درجة mIOU تبلغ 52.5%.