تنبؤ إنتاج المحاصيل باستخدام الشبكات العصبية العميقة

إنتاج المحاصيل هو صفة معقدة للغاية تحدد من خلال عوامل متعددة مثل الجينوتايب، والبيئة، وتداخلاتها. يتطلب التنبؤ الدقيق بإنتاج المحاصيل فهمًا أساسيًا للعلاقة الوظيفية بين الإنتاج وهذه العوامل التفاعلية، وكشف هذه العلاقة يتطلب مجموعات بيانات شاملة وخوارزميات قوية. في تحدي سينجنتا للمحاصيل لعام 2018، أصدرت شركة سينجنتا عدة مجموعات بيانات كبيرة سجلت فيها أداء الجينوتايب والإنتاج لـ 2,267 هجين ذرة تم زراعتها في 2,247 موقعًا بين عامي 2008 و2016 وطلبت من المشاركين التنبؤ بأداء الإنتاج في عام 2017. كأحد الفرق الفائزة، قمنا بتصميم نهج يستخدم الشبكات العصبية العميقة (DNN) استفاد من تقنيات النمذجة والحل المتقدمة. تبين أن نموذجنا يتمتع بدقة تنبؤ فائقة، حيث بلغ خطأ الجذر المتوسط المربع (RMSE) 12% من متوسط الإنتاج و50% من الانحراف المعياري لمجموعة البيانات التحققية باستخدام بيانات الطقس المتوقعة. ومع وجود بيانات طقس مثالية، سيُخفض الخطأ الجذر المتوسط المربع إلى 11% من متوسط الإنتاج و46% من الانحراف المعياري. كما قمنا باختيار الخصائص بناءً على النموذج DNN المدرب، مما نجح في تقليل بعد المساحة الإدخال دون انخفاض كبير في دقة التنبؤ. أشارت نتائج الحسابات لدينا إلى أن هذا النموذج حقق تفوقًا كبيرًا على الطرق الأخرى الشهيرة مثل Lasso والشبكات العصبية الضحلة (SNN) وشجرة الانحدار (RT). كما كشفت النتائج أن العوامل البيئية كانت لها تأثير أكبر على إنتاج المحاصيل من الجينوتايب.