SICKLE: مجموعة بيانات صور الأقمار الصناعية متعددة الحساسات مصحوبة بمتغيرات زراعية رئيسية متعددة

توافر مجموعات بيانات جيدة الترتيب قد دفع إلى نجاح نماذج التعلم الآلي (ML). على الرغم من زيادة الوصول إلى بيانات المراقبة الأرضية في الزراعة، فإن هناك نقصًا في مجموعات البيانات المرتبة والمصنفة، مما يحد من إمكانية استخدامها في تدريب نماذج التعلم الآلي للاستشعار عن بعد (RS) في الزراعة. بهدف معالجة هذا النقص، نقدم مجموعة بيانات فريدة من نوعها تسمى SICKLE، والتي تتكون من سلسلة زمنية لصور متعددة الدقة تم التقاطها بواسطة ثلاثة أقمار صناعية متميزة: Landsat-8 و Sentinel-1 و Sentinel-2. تتضمن مجموعتنا البيانات من أجهزة استشعار متعددة الطيف والحرارية وموجات مايكروويف خلال الفترة من يناير 2018 إلى مارس 2021. نقوم ببناء كل سلسلة زمنية بالنظر إلى الممارسات الزراعية التي يتبعها المزارعون الذين يركزون بشكل أساسي على زراعة الأرز في منطقة دلتا كاويري بولاية تاميل نادو، الهند؛ ونقوم بتوضيح الصور المرتبطة بمعلمات زراعية رئيسية بدرجات دقة متعددة (أي 3 أمتار، 10 أمتار و 30 مترًا). تتكون مجموعتنا البيانات من 2,370 عينة موسمية من 388 قطعة أرض فريدة، بمتوسط حجم قدره 0.38 فدان، لتصنيف أنواع المحاصيل الـ 21 عبر أربع مقاطعات في الدلتا، والتي تعادل حوالي 209,000 صورة قمر صناعي. من بين العينات الـ 2,370، تم توضيح 351 عينة أرز من 145 قطعة أرض بمعلمات زراعية متعددة؛ مثل نوع الأرز، موسم نموه وإنتاجيته بمقاييس الإنتاج لكل فدان. كما أنها تعد واحدة من أوائل الدراسات التي تأخذ في الاعتبار الأنشطة المتعلقة بموسم النمو ذات الصلة بفيزيولوجيا المحاصيل (تشمل تواريخ البذر والزراعة والحصاد) كمعلمات ذات أهمية. قمنا بتقييم مجموعة البيانات SICKLE على ثلاث مهمات: تصنيف المحاصيل، فيزيولوجيا المحاصيل (البذر والزراعة والحصاد)، وتوقع الإنتاج.