تحسين تقسيم المحاصيل في سلسلة صور الأقمار الصناعية باستخدام شبكات التحويل
أظهرت دراسات حديثة أن الشبكات العصبية التلافيفية (CNNs) تحقق نتائج مذهلة في تقسيم المحاصيل في صور الأقمار الصناعية المتسلسلة زمنيًا (SITS). ومع ذلك، فإن ظهور شبكات الترانسفيرمر في مهام الرؤية المختلفة يثير تساؤلًا حول إمكانية تفوقها على الشبكات التلافيفية في تقسيم المحاصيل ضمن صور SITS. تقدم هذه الورقة نسخة معدلة من نموذج Swin UNETR القائم على الترانسفيرمر، تم تكييفه خصيصًا لتقسيم المحاصيل في صور SITS. يُظهر النموذج المقترح تقدمًا كبيرًا، حيث حقق دقة تحقق بلغت 96.14% ودقة اختبار بلغت 95.26% على مجموعة بيانات ميونيخ، متفوقًا على أفضل النتائج السابقة التي بلغت 93.55% للتحقق و92.94% للاختبار. بالإضافة إلى ذلك، أظهر النموذج أداءً مماثلاً لنموذج UNet3D على مجموعة بيانات لومبارديا، ومتفوقًا على نماذج FPN وDeepLabV3. تشير التجارب التي أُجريت في هذه الدراسة إلى أن النموذج من المرجح أن يحقق دقة مماثلة أو أفضل من الشبكات التلافيفية، مع استهلاك وقت تدريب أقل بشكل كبير. تُبرز هذه النتائج الإمكانات الكبيرة للاعتماد على الهياكل القائمة على الترانسفيرمر في تقسيم المحاصيل ضمن صور SITS، مما يفتح آفاقًا جديدة لتطبيقات الاستشعار عن بعد.