تستخدم جامعة كيوتو شبكة CNN للتنبؤ بإنتاج الغذاء. الحصاد الجيد لا يعتمد على الطقس، فقط اسأل الذكاء الاصطناعي.

وتتوقع الأمم المتحدة أن يصل عدد سكان العالم إلى 9.1 مليار نسمة بحلول عام 2050، وأن الطلب العالمي على الغذاء سيرتفع بنحو 701 مليار طن.
ومع ذلك، بسبب التطور غير المتوازن للزراعة في العالم، لا يمكن إحصاء إنتاج الحبوب في العديد من المناطق بشكل دقيق، وبالتالي من المستحيل وضع خطط معقولة للتنمية الزراعية في هذه المناطق. من الصعب الترويج للطرق الحالية لحساب إنتاج الحبوب أو تتطلب مستوى أعلى من التكنولوجيا.
ولتحقيق هذه الغاية، استخدم باحثون من جامعة كيوتو الشبكات العصبية التلافيفية (CNN) لتحليل صور الأراضي الزراعية وحساب إنتاج الغذاء المحلي بكفاءة ودقة، مما يوفر طريقة جديدة لتعزيز التنمية الزراعية العالمية.
المؤلف | شيويه تساي
المحرر | سانيانغ
تم نشر هذه المقالة لأول مرة على منصة HyperAI WeChat العامة~
من المتوقع أن يرتفع الطلب العالمي على الغذاء بنحو 701 طن متري بحلول عام 2050، مدفوعاً بنمو السكان وارتفاع الدخول والاستخدام الواسع النطاق للوقود الحيوي.
ومع ذلك، بسبب الاحتباس الحراري وانخفاض التنوع البيولوجي،إن إنتاج الغذاء في جميع أنحاء العالم عرضة بشكل كبير للتغيرات البيئية، كما أن التنمية غير متساوية بين المناطق.

الشكل 1: خريطة إنتاج الحبوب العالمي 2020
ومن الواضح أن الصين والولايات المتحدة والهند والبرازيل هي المناطق الرئيسية المنتجة للحبوب.يعتبر إنتاج الغذاء في نصف الكرة الجنوبي منخفضًا نسبيًا. وعلاوة على ذلك، ونظرا لانخفاض الإنتاجية الزراعية في نصف الكرة الجنوبي، فمن الصعب قياس إنتاج الغذاء بشكل دقيق.ولذلك، فمن الصعب علينا أن نتمكن من تقييم الإنتاجية الزراعية المحلية بشكل فعال، ناهيك عن توفير الوسائل الفعالة لزيادة الإنتاج.
هناك حاليًا ثلاث طرق شائعة الاستخدام لإحصاءات إنتاج الحبوب، بما في ذلك الإبلاغ الذاتي والقياس الفعلي وإحصاءات الاستشعار عن بعد.ومن الصعب الترويج للطريقتين الأوليين على نطاق واسع، في حين أن استخدام تكنولوجيا الاستشعار عن بعد سيكون مقيدًا بالمستوى العلمي والتكنولوجي المحلي.
ولتحقيق هذه الغاية، استخدم باحثون من جامعة كيوتو الشبكات العصبية التلافيفية (CNN) لتحليل صور الأراضي الزراعية الملتقطة على الفور، ثم قاموا بحساب إنتاج الحبوب المحلي. وتظهر النتائج أنيمكن لنموذج CNN حساب إنتاج الأرز بسرعة ودقة في مرحلة الحصاد ومرحلة النضج المتأخر في ظل ظروف الإضاءة المختلفة.وقد تم نشر هذه النتيجة في مجلة Plant Phenomics.

رابط الورقة:
https://spj.science.org/doi/10.34133/plantphenomics.0073
الإجراءات التجريبية
1. إنشاء قاعدة بيانات:صور مظلة الأرز + إنتاج الحبوب
قام الباحثون بجمع صور لمحاصيل الأرز والحبوب في 20 مزرعة في سبع دول. عندما ينضج الأرز، تم استخدام كاميرا رقمية لالتقاط صور عمودية لأسفل من ارتفاع 0.8 إلى 0.9 متر فوق مظلة الأرز للحصول على صورة بمسافة متر واحد.2 صورة RGB للأرز.
ملاحظة: مظلة الأرز هي الطبقة العليا من فروع وأوراق الأرز الكثيفة، وهي الجزء الرئيسي من النبات لعملية التمثيل الضوئي.
ثم قاموا بتغيير زاوية التصوير والوقت والفترة، وفي بعض التجارب قاموا بإزالة نورات الأرز واحدة تلو الأخرى لاستكشاف آلية نموذج CNN في التنبؤ بالمحصول.وفي النهاية، حصلوا على 22067 صورة RGB لـ 462 نوعًا من الأرز من 4820 موقع تصوير.
كان محصول الحبوب في التجربة عبارة عن محصول حبوب خشن، بما في ذلك الوزن الإجمالي لحبوب الأرز المملوءة والفارغة. ويتراوح العائد الإحصائي للحبوب بين 0.1 طن/هكتار (طن لكل هكتار) و16.1 طن/هكتار، مما يدل على توزيع طبيعي، بمتوسط عائد يبلغ حوالي 5.8 طن/هكتار.

الشكل 2: صورة لمظلة الأرز وتوزيع محصول الحبوب
أ: توزيع إنتاج الحبوب الخشنة في سبع دول؛
ب: مخطط دائري يوضح متوسط إنتاج الحبوب الخشنة في بلدان مختلفة؛
ج: صورة الأرز ذو أعلى إنتاج للحبوب الخشنة؛
د: صورة للأرز الذي يحتوي على أقل كمية من الحبوب الخشنة.
2. توقعات الإنتاج:صور المظلة + CNN → إنتاج الغذاء
يتم نشر نموذج CNN ودالة الخسارة والمُحسِّن باستخدام لغة Python وإطار عمل PyTorch. وبعد ذلك، قام الباحثون بحساب خسارة التحقق والخطأ الجذري التربيعي النسبي (rRMSE) عند اكتمال تدريب النموذج من خلال الجمع بين أحجام دفعات مختلفة ومعدلات التعلم.تم الحصول على حجم الدفعة الأمثل (32) ومعدل التعلم (0.0001) للنموذج.
يحتوي نموذج CNN على 5 طبقات ملتوية في التيار الرئيسي (MS) و 4 طبقات ملتوية في التيار المتفرع (BS).تتضمن طبقات التجميع في النموذج طبقة التجميع المتوسطة (AveragePooling) وطبقة التجميع القصوى (MaxPooling). تتكون دالة التنشيط بشكل أساسي من وحدة خطية مصححة (ReLU)، ويتم استخدام وحدة خطية أسيّة (ELU) في بعض الأجزاء.أخيرًا، يتم دمج MS وBS ويتم إخراج محصول الحبوب المقدر من خلال طبقة ReLU.

الشكل 3: مخطط نموذج CNN
يتمتع نموذج CNN بقدرة قوية على التمييز بين الصور.عندما تكون مسافة أخذ العينات الأرضية (GSD، المسافة الفعلية المقابلة لكل بكسل في الصورة، والتي تكون معاكسة للدقة) 0.2 سم/بكسل، فإن معامل الارتباط R بين نتيجة التنبؤ بنموذج CNN والنتيجة الفعلية هو2 أعلى من 0.65. حتى لو زاد GSD إلى 3.2 سم/بكسل، فإن R2 ويمكن أيضًا الحفاظ عليه فوق 0.55.

الشكل 4: العلاقة بين نتائج تنبؤات نموذج CNN وGSD
أ: العلاقة بين R2 لنموذج CNN وGSD لمجموعة التحقق وصور مجموعة الاختبار؛
ب: رسم بياني لتشتت الناتج المتوقع لنموذج CNN والناتج الفعلي؛
ج و د: صور تخطيطية للـGSD بحجم 0.2 سم/بكسل و 3.2 سم/بكسل.
علاوة على ذلك، قام الباحثون باختبار نموذج CNN باستخدام البيانات من مجموعة التنبؤ. يمكن لنموذج CNN التمييز بين الفرق في إنتاج الأرز بين تاكاناري وكوشيهيكاري في طوكيو، والبيانات المتوقعة قريبة من البيانات الفعلية.

الشكل 5: العائد الفعلي (أ) والعائد المتوقع (ب) لأرز جاوشينغ وأرز كوشيهيكاري
ثم قام الفريق بحجب الصور لاستكشاف الآلية التي استخدمها نموذج CNN لتحليل الصور والتنبؤ بإنتاج الغذاء. قاموا بحجب مناطق محددة من الصور باستخدام كتل رمادية وقاموا بحساب الفرق في العائد المتوقع بواسطة نموذج CNN قبل وبعد الحجب.

الشكل 6: مخطط تخطيطي لتجربة الانسداد
أ: الصورة قبل الانسداد؛
ب: الصورة بعد الانسداد؛
ج: وزن المناطق المختلفة من الصورة على العائد المتوقع.
وأظهرت النتائج أن إنتاج الحبوب كان مرتبطا بشكل إيجابي مع عدد نورات الأرز، ومرتبطا بشكل سلبي مع نسبة العناصر مثل السيقان والأوراق والأرض في الصورة.
لذلك، قام الباحثون بالتحقق من دور النورات في التنبؤ بالمحصول من خلال تجارب إزالة النورات. قاموا باختيار نورتين من كل نبات أرز، وقاموا بالتقاط الصور وحساب محصول الحبوب الخشنة حتى تم اختيار كل النورات.

الشكل 7: تجربة إزالة النورات والنتائج
أ: رسم تخطيطي لتجربة إزالة النورات؛
ب: صورة بعد إزالة النورة؛
ج: مخطط خطي للناتج المتوقع والناتج الفعلي؛
د: العلاقة بين المحصول المتوقع والعائد الفعلي أثناء إزالة النورات.
ومع انخفاض عدد النورات، استمرت نتائج التنبؤ بالمحصول لنموذج CNN في الانخفاض، حتى انخفضت في النهاية إلى 1.6 طن/هكتار.تظهر هذه التجربة أن نموذج CNN يحكم بشكل أساسي على محصول الحبوب بناءً على عدد النورات في الصورة.
3. المتانة:زاوية الصورة والوقت والفترة
بعد التحقق من قدرة نموذج CNN على التنبؤ بإنتاج الحبوب،قام الباحثون بتنويع زوايا التصوير والأوقات والفترات لاستكشاف مدى قوة نموذج CNN في ظل ظروف مختلفة.
تم التقاط الصور بزوايا تتراوح بين 20 درجة و90 درجة، مع فاصل اختبار قدره 10 درجات.وتظهر النتائج أن دقة التنبؤ لنموذج CNN تزداد مع زيادة زاوية التصوير.عندما يكون خطأ التصوير 20 درجة، تكون نتيجة التنبؤ لنموذج CNN هي -3.7-2.4 طن/هكتار. عندما كانت زاوية التصوير 60 درجة، كان خطأ التنبؤ بين -0.45 و 2.44 طن / هكتار، وهو قريب من نتيجة التنبؤ عند 90 درجة.

الشكل 8: اختبار زاوية التصوير والنتائج
أ: رسم تخطيطي لتجربة زاوية التصوير؛
ب: صور تم التقاطها من زوايا تصوير مختلفة؛
ج: الفرق بين العائد المتوقع والعائد الفعلي من الصور الملتقطة من زوايا مختلفة.
تم بعد ذلك وضع الكاميرا في وضع ثابت لالتقاط صورة للأرض الزراعية كل 30 دقيقة لاستكشاف تأثير وقت التصوير على نموذج CNN.وتظهر النتائج أنه على الرغم من تغير بيئة الإضاءة، فإن نتائج التنبؤ بنموذج CNN للصور الملتقطة طوال اليوم مستقرة بشكل أساسي.

الشكل 9: اختبار وقت التصوير والنتائج
أ: رسم تخطيطي لتجربة وقت التصوير؛
ب: الصور الملتقطة في أوقات تصوير مختلفة؛
ج: العائد التنبؤي لنموذج CNN للصور الملتقطة في أوقات مختلفة.
وأخيرا، قام الباحثون باستكشاف تأثير فترة إطلاق النار على نتائج التنبؤ لنموذج CNN.بعد أن توجه الأرز 50%، ذهبوا إلى الحقول كل أسبوع لجمع الصور وتحليلها باستخدام نموذج CNN. في المرحلة المبكرة من نضج الأرز، يكون العائد المتوقع لنموذج CNN أقل من العائد الفعلي في وقت الحصاد لأن النورة لم تنضج بالكامل بعد.
وبمرور الوقت، أصبحت توقعات نموذج CNN تقترب تدريجيا من الإنتاج الفعلي. بعد أربعة أسابيع من التوجه، كانت نتائج التنبؤ لنموذج CNN مستقرة بشكل أساسي وقريبة من العائد الفعلي لـ 50%.

الشكل 10: الاختبارات والنتائج أثناء التصوير
ج: تم التقاط الصور في أوقات تصوير مختلفة، DAH تعني الأيام بعد الحصاد، وDBH تعني الأيام قبل الحصاد؛
ب: نتائج التنبؤ لنموذج CNN للصور الملتقطة في أوقات مختلفة.
تظهر النتائج المذكورة أعلاه بشكل جماعي أن نموذج CNN يمكنه تحليل صور الأراضي الزراعية الملتقطة بدقة عند زوايا تصوير وأوقات وفترة زمنية مختلفة، والحصول على نتائج تنبؤ مستقرة للمحصول. نماذج CNN قوية.
الزراعة الذكية: الذكاء الاصطناعي يساعد في التخطيط الزراعي
وفقا للأمم المتحدة، سيصل عدد سكان العالم إلى حوالي 9.1 مليار نسمة في عام 2050. ومع نمو سكان العالم وارتفاع الدخول، يتزايد الطلب على الغذاء أيضًا.
وفي الوقت نفسه، أدى تكثيف الإنتاج الزراعي ورقمنته وذكائه إلى زيادة إنتاج الحبوب لكل مو بشكل مستمر. من عام 2000 إلى عام 2019، انخفضت مساحة الأراضي الزراعية العالمية بمقدار 3%، في حين زاد إنتاج المحاصيل الرئيسية بمقدار 52%، كما زاد إنتاج الفواكه والخضروات أيضًا بنحو 20%.
إن استخدام المعدات الاحترافية مثل الحصادات الكبيرة والطائرات بدون طيار يسمح للمزارعين بالتخطيط لأراضيهم الزراعية بدقة وراحة. تساعد التقنيات مثل البيانات الضخمة وإنترنت الأشياء المزارعين على إدراك ظروف الأراضي الزراعية في الوقت الفعلي، كما يمكنها أيضًا ضبط البيئة داخل الدفيئة تلقائيًا. يمكن للتنبؤات الجوية المبكرة باستخدام التعلم العميق والنماذج الكبيرة منع الطقس المتطرف قبل حدوثه وتخفيف مشكلة الزراعة التقليدية التي تعتمد على الطقس في معيشتها.

الشكل 11: مخطط تخطيطي لنظام الزراعة الذكية
ومع ذلك، اعتبارًا من عام 2021، ارتفع عدد الأشخاص المتضررين من الجوع في جميع أنحاء العالم بنحو 46 مليون شخص عن العام السابق، ليصل إلى 828 مليون شخص.لا تزال مشاكل الإنتاج الزراعي غير المتوازن والنظام غير المثالي قائمة بل وأكثر وضوحا.
بمساعدة الذكاء الاصطناعي، يمكننا إعداد خطط أفضل للتنمية الزراعية المحلية.تعزيز التنمية المتوازنة للإنتاج الزراعي العالمي وتوفير إجابة مرضية لحل مشكلة الجوع العالمية.
روابط مرجعية:
[1] https://www.fao.org/documents/card/en/c/cc2211en
[2] https://www.deccanherald.com/opinion/smart-farming-tech-new-age-700994.html
تم نشر هذه المقالة لأول مرة على منصة HyperAI WeChat العامة~