HyperAI

موارد الاستشعار عن بعد (الجزء الأول): استخدام الكود مفتوح المصدر لتدريب نماذج تصنيف الأراضي

منذ 4 أعوام
العناوين الرئيسية
معلومة
神经小兮
特色图像

يعد تصنيف الأراضي أحد أهم سيناريوهات تطبيق صور الاستشعار عن بعد. تقدم هذه المقالة عدة طرق شائعة لتصنيف الأراضي وتستخدم كود التجزئة الدلالية مفتوح المصدر لإنشاء نموذج تصنيف الأراضي.

تُعد صور الاستشعار عن بعد بيانات مهمة لأعمال المسح ورسم الخرائط والمعلومات الجغرافية. وتتمتع بأهمية كبيرة في مراقبة الظروف الجغرافية الوطنية وتحديث قواعد بيانات المعلومات الجغرافية، وتلعب دورًا متزايد الأهمية في المجالات العسكرية والتجارية ومعيشة الناس.

في السنوات الأخيرة، مع تحسن قدرات البلاد على التقاط صور الأقمار الصناعية، تم تحسين كفاءة جمع بيانات صور الاستشعار عن بعد بشكل كبير، مما شكل نمطًا تتعايش فيه أجهزة استشعار متعددة مثل الدقة المكانية المنخفضة، والدقة المكانية العالية، وزاوية الرؤية الواسعة، والزاوية المتعددة، والرادار، وما إلى ذلك.

لاندسات 2 في مداره لجمع بيانات الاستشعار عن بعد للأرض. كان القمر الصناعي هو الثاني في برنامج Landsat التابع لوكالة ناسا وتم إطلاقه في عام 1975 للحصول على بيانات موسمية عالمية بدقة متوسطة.

مجموعة كاملة من أجهزة الاستشعار لتلبية احتياجات مراقبة الأرض لأغراض مختلفة.ومع ذلك، فقد تسبب أيضًا في حدوث مشكلات مثل تنسيقات بيانات صور الاستشعار عن بعد غير المتسقة واستهلاك كمية كبيرة من مساحة التخزين.غالبًا ما تكون هناك تحديات كبيرة في عملية معالجة الصور.

إذا أخذنا تصنيف الأراضي كمثال، ففي الماضي، كانت صور الاستشعار عن بعد تستخدم لتصنيف الأراضي.غالبًا ما تعتمد على قدر كبير من القوى العاملة في وضع العلامات والإحصائيات،يستغرق الأمر عدة أشهر أو حتى سنة؛ وبالإضافة إلى تعقيد وتنوع أنواع الأراضي، فإن الأخطاء الإحصائية البشرية أمر لا مفر منه.

مع تطور تكنولوجيا الذكاء الاصطناعي، أصبحت عملية الحصول على صور الاستشعار عن بعد ومعالجتها وتحليلها أكثر ذكاءً وكفاءة.

طرق تصنيف الأراضي الشائعة

تنقسم طرق تصنيف الأراضي المستخدمة بشكل شائع إلى ثلاث فئات:طرق التصنيف التقليدية المعتمدة على نظم المعلومات الجغرافية، وطرق التصنيف المعتمدة على خوارزميات التعلم الآلي، وطرق التصنيف باستخدام التجزئة الدلالية للشبكات العصبية.

الطريقة التقليدية: استخدام تصنيف نظم المعلومات الجغرافية 

نظام المعلومات الجغرافية (GIS) هو أداة تستخدم غالبًا عند معالجة صور الاستشعار عن بعد. اسمه الكامل هو نظام المعلومات الجغرافية، والمعروف أيضًا باسم نظام المعلومات الجغرافية.ويدمج التقنيات المتقدمة مثل إدارة قواعد البيانات العلائقية، وخوارزميات الرسم البياني الفعالة، والاستيفاء، وتقسيم المناطق، وتحليل الشبكات.جعل التحليل المكاني بسيطًا وسهلاً.

التحليل المكاني للفرع الشرقي لنهر إليزابيث باستخدام نظم المعلومات الجغرافية

باستخدام تكنولوجيا التحليل المكاني GIS،ويمكنه الحصول على معلومات عن الموقع المكاني والتوزيع والشكل والتكوين وتطور نوع الأرض المقابل.تحديد ميزات الأرض وإصدار الأحكام.

التعلم الآلي: استخدام الخوارزميات للتصنيف 

تشمل طرق تصنيف الأراضي التقليدية التصنيف الخاضع للإشراف والتصنيف غير الخاضع للإشراف.

يُطلق على التصنيف المُشرف أيضًا اسم تصنيف التدريب.يشير إلى مقارنة وتحديد وحدات البكسل من الفئات غير المعروفة مع وحدات البكسل من عينات التدريب من الفئات المؤكدة.ثم أكمل تصنيف نوع الأرض بأكمله.

في التصنيف الخاضع للإشراف، عندما لا تكون عينات التدريب دقيقة بدرجة كافية، يتم عادةً إعادة تحديد منطقة التدريب أو تعديلها يدويًا بصريًا لضمان دقة بكسلات عينة التدريب.

صورة الاستشعار عن بعد بعد التصنيف المشرف (يسار): يمثل اللون الأحمر أراضي البناء ويمثل اللون الأخضر أراضي غير البناء

يعني التصنيف غير الخاضع للإشراف أنه ليست هناك حاجة للحصول على معايير فئة مسبقة مسبقًا، ولكن يتم إجراء التصنيف الإحصائي وفقًا للخصائص الطيفية للبكسلات في صورة الاستشعار عن بعد بالكامل.تتمتع هذه الطريقة بدرجة عالية من الأتمتة وتتطلب القليل من التدخل البشري.

بمساعدة خوارزميات التعلم الآلي مثل آلات دعم المتجهات وطرق الاحتمالية القصوى، يمكن تحسين كفاءة ودقة التصنيف الخاضع للإشراف وغير الخاضع للإشراف بشكل كبير. 

الشبكات العصبية: استخدام التجزئة الدلالية للتصنيف 

التجزئة الدلالية هي طريقة تصنيف شاملة على مستوى البكسل يمكنها تعزيز فهم الآلة للمشاهد البيئية وتستخدم على نطاق واسع في مجالات مثل القيادة الذاتية وتخطيط الأراضي.

تتمتع تقنية التجزئة الدلالية القائمة على الشبكات العصبية العميقة بأداء أفضل من طرق التعلم الآلي التقليدية عند التعامل مع مهام التصنيف على مستوى البكسل.

استخدام خوارزمية التجزئة الدلالية لتحديد صور الاستشعار عن بعد لمكان معين والحكم عليها

تحتوي صور الاستشعار عن بعد عالية الدقة على مشاهد معقدة وتفاصيل غنية، والاختلافات الطيفية بين الكائنات غير مؤكدة، مما قد يؤدي بسهولة إلى دقة تقسيم منخفضة أو حتى تقسيم غير صالح.

استخدام التجزئة الدلالية لمعالجة صور الاستشعار عن بعد عالية الدقة وفائقة الدقة،
يمكن استخراج ميزات البكسل في الصورة بشكل أكثر دقة، ويمكن تحديد أنواع الأراضي المحددة بسرعة ودقة، وبالتالي تحسين سرعة معالجة صور الاستشعار عن بعد.

نماذج التجزئة الدلالية مفتوحة المصدر المستخدمة بشكل شائع

تتضمن نماذج التجزئة الدلالية على مستوى البكسل المفتوحة المصدر المستخدمة بشكل شائع FCN وSegNet وDeepLab.

1. الشبكة التلافيفية الكاملة (FCN)

الخاصية:التجزئة الدلالية من البداية إلى النهاية
ميزة:لا توجد قيود على حجم الصورة، عالمية وفعالة
عيب:غير قادر على إجراء التفكير في الوقت الفعلي بسرعة، ونتائج المعالجة ليست دقيقة بما يكفي، وليست حساسة لتفاصيل الصورة

2. سيج نت 

الخاصية:نقل مؤشر التجميع الأقصى إلى جهاز فك التشفير، مما يؤدي إلى تحسين دقة التجزئة
ميزة:سرعة تدريب سريعة وكفاءة عالية واستخدام منخفض للذاكرة
عيب:الاختبار ليس تغذية أمامية ويجب تحسينه لتحديد علامة MAP

3. ديب لاب 

تم إصدار DeepLab بواسطة Google AI.الدعوة إلى استخدام DCNN لحل مهام التجزئة الدلالية،هناك أربعة إصدارات في المجموع: v1، v2، v3، و v3+.

يقوم DeepLab-v1 بحل مشكلة فقدان المعلومات الناتجة عن التجميع.تم اقتراح طريقة الالتفاف المتوسع.يتم توسيع المجال الاستقبالي دون زيادة عدد المعلمات، مع ضمان عدم فقدان المعلومات.

عرض عملية نموذج DeepLab-v1


يعتمد DeepLab-v2 على v1.تمت إضافة التوازي متعدد المقاييس،تم حل مشكلة التجزئة المتزامنة للأشياء ذات الأحجام المختلفة.

DeepLab-v3 يتم تطبيق التفاف الحفرة على وحدة المتتالية.وتم تحسين وحدة ASPP.

DeepLab-v3+ يتم استخدام وحدة SPP في بنية المشفر-الفك.يمكن استعادة حواف الأشياء الدقيقة. تحسين نتائج التجزئة.

إعداد التدريب النموذجي

غاية:بناءً على DeepLab-v3+، قم بتطوير نموذج تصنيف مكون من 7 تصنيفات لتصنيف الأراضي

بيانات:304 صور استشعار عن بعد لمنطقة من Google Earth. بالإضافة إلى الصورة الأصلية، فهي تتضمن أيضًا صورًا داعمة مكونة من 7 فئات، وصورًا مكونة من 7 فئات، وصورًا مكونة من 25 فئة، وصورًا مكونة من 25 فئة، مع شرح احترافي لها. دقة الصورة هي 560 * 560 ومعدل التخصيص المكاني هو 1.2 متر.

مثال على خياطة الصورة الأصلية والصورة المقابلة لها من الفئة 7
الجزء العلوي هو الصورة الأصلية، والجزء السفلي هو صورة التصنيف 7


كود تعديل المعلمة هو كما يلي:

net = DeepLabV3Plus(backbone = 'xception')criterion = CrossEntropyLoss()optimizer = optim.SGD(net.parameters(), lr=0.05, momentum=0.9,weight_decay=0.00001) lr_fc=lambda iteration: (1-iteration/400000)**0.9exp_lr_scheduler = lr_scheduler.LambdaLR(optimizer,lr_fc,-1)

تفاصيل التدريب

اختيار معدل التجزئة:نفيديا T4
إطار التدريب:باي تورش الإصدار 1.2
التكرارات:العصر 600
مدة التدريب:حوالي 50 ساعة
اي يو:0.8285 (بيانات التدريب)
التيار المتردد:0.7838 (بيانات التدريب)

رابط مجموعة البيانات: https://openbayes.com/console/openbayes/datasets/qiBDWcROayo

رابط مباشر لعملية التدريب التفصيلية: https://openbayes.com/console/openbayes/containers/dOPqM4QBeM6

تفاصيل البرنامج التعليمي العام لتصنيف صور الاستشعار عن بعد للأرض السبعة

  استخدام البرنامج التعليمي 

ملف العرض النموذجي في البرنامج التعليمي هو predict.ipynb. سوف يؤدي تشغيل هذا الملف إلى تثبيت البيئة وعرض تأثير التعرف على النموذج الحالي.

  مسار المشروع 

–  مسار صورة الاختبار:

semantic_pytorch/out/result/pic3

–  مسار صورة القناع:

semantic_pytorch/out/result/label

–  توقع مسار الصورة:

semantic_pytorch/الخروج/النتيجة/التنبؤ

–  قائمة بيانات التدريب:قطار.csv

–  قائمة بيانات الاختبار:اختبار.csv

  تعليمات 

يدخل نموذج التدريب إلى semantic_pytorch ويتم حفظ النموذج المدرب في model/new_deeplabv3_cc.pt. 

يستخدم النموذج DeepLabV3plus، وفي معلمات التدريب، يستخدم Loss إنتروبيا متقاطعة ثنائية. رقم العصر هو 600 ومعدل التعلم الأولي هو 0.05.

  تعليمات التدريب:

python main.py

إذا كنت تستخدم النموذج الذي قمنا بتدريبه، فاحفظه في مجلد النموذج fix_deeplab_v3_cc.pt واتصل به مباشرة في predict.py.

  التعليمات التنبؤية:

python predict.py

عنوان البرنامج التعليمي:https://openbayes.com/console/openbayes/containers/dOPqM4QBeM6

المؤلف النموذجي:

وانغ يانكسين، طالب هندسة برمجيات في السنة الثانية بجامعة هيلونغجيانغ، ومتدرب حاليًا في OpenBayes.

السؤال 1: لتطوير هذا النموذج، ما هي القنوات التي استخدمتها وما هي المعلومات التي استشارتها؟

وانغ يانكسين:من خلال المجتمعات التقنية وGitHub والقنوات الأخرى بشكل أساسي، قمت بفحص بعض أوراق DeepLab-v3+ وحالات المشاريع ذات الصلة، وتعلمت مسبقًا ما هي المخاطر وكيفية التغلب عليها، وقمت بالتحضيرات الكافية للاستعلام عن المشكلات وحلها في أي وقت عند مواجهة مشاكل في عملية تطوير النموذج اللاحقة.

السؤال 2: ما هي العقبات التي واجهتك أثناء العملية؟ كيف تغلبت عليها؟

وانغ يانكسين:كمية البيانات ليست كافية، مما يؤدي إلى أداء متوسط لـ IoU و AC. في المرة القادمة، يمكنك محاولة استخدام مجموعة بيانات الاستشعار عن بعد العامة ذات البيانات الأكثر ثراءً.

السؤال 3: ما هي الاتجاهات الأخرى التي تريد تجربتها فيما يتعلق بالاستشعار عن بعد؟

وانغ يانكسين:هذه المرة أقوم بتصنيف الأرض. بعد ذلك، أريد استخدام مزيج من التعلم الآلي وتكنولوجيا الاستشعار عن بعد لتحليل المناظر الطبيعية للمحيطات والعناصر البحرية، أو الجمع بين التكنولوجيا الصوتية لمحاولة تحديد تضاريس قاع البحر والحكم عليها.


كمية البيانات المستخدمة في هذا التدريب صغيرة نسبيًا، وأداء IoU وAC في مجموعة التدريب متوسط. يمكنك أيضًا محاولة استخدام مجموعات بيانات الاستشعار عن بعد العامة الموجودة لتدريب النماذج. بشكل عام، كلما كان التدريب شاملاً وكلما كانت بيانات التدريب أكثر ثراءً، كان أداء النموذج أفضل.

في المقالة القادمة في هذه السلسلة،لقد قمنا بتجميع 11 مجموعة بيانات عامة للاستشعار عن بعد وتصنيفها.يمكنك الاختيار وفقًا لاحتياجاتك وتدريب نموذج أكثر اكتمالاً استنادًا إلى أفكار التدريب المقدمة في هذه المقالة.

الرجوع إلى:

http://tb.sinomaps.com/CN/0494-0911/home.shtml
file:///Users/antonia0912/Downloads/2018-6A-50.pdf
https://zhuanlan.zhihu.com/p/75333140
http://www.mnr.gov.cn/zt/zh/zljc/201106/t20110619_2037196.html