تحسين تقسيم المحاصيل في سلسلة صور الأقمار الصناعية باستخدام شبكات التحويل
{A. U. Rehman Riccardo La Grassa M. Boschetti C. Loschiavo Nicola Landro Mattia Gatti Ignazio Gallo}
الملخص
أظهرت دراسات حديثة أن الشبكات العصبية التلافيفية (CNNs) تحقق نتائج مذهلة في تقسيم المحاصيل في صور الأقمار الصناعية المتسلسلة زمنيًا (SITS). ومع ذلك، فإن ظهور شبكات الترانسفيرمر في مهام الرؤية المختلفة يثير تساؤلًا حول إمكانية تفوقها على الشبكات التلافيفية في تقسيم المحاصيل ضمن صور SITS. تقدم هذه الورقة نسخة معدلة من نموذج Swin UNETR القائم على الترانسفيرمر، تم تكييفه خصيصًا لتقسيم المحاصيل في صور SITS. يُظهر النموذج المقترح تقدمًا كبيرًا، حيث حقق دقة تحقق بلغت 96.14% ودقة اختبار بلغت 95.26% على مجموعة بيانات ميونيخ، متفوقًا على أفضل النتائج السابقة التي بلغت 93.55% للتحقق و92.94% للاختبار. بالإضافة إلى ذلك، أظهر النموذج أداءً مماثلاً لنموذج UNet3D على مجموعة بيانات لومبارديا، ومتفوقًا على نماذج FPN وDeepLabV3. تشير التجارب التي أُجريت في هذه الدراسة إلى أن النموذج من المرجح أن يحقق دقة مماثلة أو أفضل من الشبكات التلافيفية، مع استهلاك وقت تدريب أقل بشكل كبير. تُبرز هذه النتائج الإمكانات الكبيرة للاعتماد على الهياكل القائمة على الترانسفيرمر في تقسيم المحاصيل ضمن صور SITS، مما يفتح آفاقًا جديدة لتطبيقات الاستشعار عن بعد.
المعايير القياسية
| معيار قياسي | المنهجية | المقاييس |
|---|---|---|
| semantic-segmentation-on-lombardia-sentinel-2 | UNet3D | Overall Accuracy: 80.77 |
| semantic-segmentation-on-lombardia-sentinel-2 | DeepLabv3 3D | Overall Accuracy: 74.51 |
| semantic-segmentation-on-lombardia-sentinel-2 | Swin UNETR | Overall Accuracy: 79.64 |
| semantic-segmentation-on-lombardia-sentinel-2 | 3D FPN with NDVI Loss | Overall Accuracy: 77.23 |
| unet-segmentation-on-munich-sentinel2-crop-1 | UNet3D | Overall Accuracy: 94.73 |
| unet-segmentation-on-munich-sentinel2-crop-1 | Swin UNETR | Overall Accuracy: 95.26 |
| unet-segmentation-on-munich-sentinel2-crop-1 | DeepLabv3 3D | Overall Accuracy: 85.98 |
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.