لوفدا: مجموعة بيانات لتصنيف التغطية الأرضية من الاستشعار عن بعد للفئات التكيفية في التجزئة الدلالية

أظهرت النماذج القائمة على التعلم العميق نتائج واعدة في رسم الخرائط لاستخدامات الأراضي ذات الدقة الفضائية العالية (HSR) في الاستشعار عن بعد. ومع ذلك، يمكن أن تُظهر المشاهد الحضرية والريفية مناظر جغرافية مختلفة تمامًا، ويتسبب ضعف قدرة التعميم لهذه الخوارزميات في إعاقة إجراء رسم خرائط على مستوى المدينة أو المستوى الوطني. تركز معظم مجموعات البيانات الحالية المتعلقة بخرائط استخدامات الأراضي ذات الدقة الفضائية العالية بشكل رئيسي على تعزيز أبحاث تمثيل المعنى، مما يؤدي إلى إهمال قابلية انتقال النماذج. في هذه الورقة، نقدّم مجموعة بيانات تُدعى Land-cOVEr Domain Adaptive semantic segmentation (LoveDA) لتعزيز التعلم المعنوي والقابلية للانتقال. تحتوي مجموعة بيانات LoveDA على 5987 صورة ذات دقة فضائية عالية، مع 166768 كائنًا مُعلَّمًا، مستمدة من ثلاث مدن مختلفة. مقارنةً بمجاميع البيانات الحالية، تضم مجموعة بيانات LoveDA مجالين (حضري وريفي)، مما يُشكّل تحديات كبيرة نظرًا لـ: 1) الأشياء متعددة المقاييس؛ 2) عينات خلفية معقدة؛ و3) توزيعات فئات غير متسقة. تُعدّ مجموعة بيانات LoveDA مناسبة لكل من مهام فصل دلالي استخدامات الأراضي ومهام التكييف دون تعلّم مراقب (UDA). وعليه، قمنا بتوثيق أداء مجموعة بيانات LoveDA على أحد عشر أسلوبًا للفصل الدلالي، وثمانية أساليب لـ UDA. كما أجرينا دراسات استكشافية تشمل هندسات متعددة المقاييس واستراتيجيات مكملة، ورقابة إضافية على الخلفيات، وتحليل التسميات الوهمية، لمعالجة هذه التحديات. يُمكن الوصول إلى الكود والبيانات عبر الرابط: https://github.com/Junjue-Wang/LoveDA.