L'Université De Kyoto Utilise CNN Pour Prédire La Production Alimentaire. Une Bonne Récolte Ne Dépend Pas De La Météo, Demandez À L’ia.

Les Nations Unies prévoient que la population mondiale devrait atteindre 9,1 milliards d’habitants en 2050 et que la demande mondiale de nourriture augmentera de 701 TP3T.
Cependant, en raison du développement inégal de l’agriculture dans le monde, la production céréalière dans de nombreuses régions ne peut pas être comptée avec précision, il est donc impossible d’élaborer des plans raisonnables pour le développement agricole de ces régions. Les méthodes existantes de comptage de la production céréalière sont difficiles à promouvoir ou nécessitent un niveau technologique plus élevé.
À cette fin, des chercheurs de l’Université de Kyoto ont utilisé des réseaux neuronaux convolutifs (CNN) pour analyser des photos de terres agricoles et ont compté de manière efficace et précise la production alimentaire locale, offrant ainsi une nouvelle méthode pour promouvoir le développement agricole mondial.
Auteur | Xuecai
Rédacteur | Sanyang
Cet article a été publié pour la première fois sur la plateforme publique HyperAI WeChat~
La demande mondiale de nourriture augmentera de 70% d’ici 2050, sous l’effet de la croissance démographique, de la hausse des revenus et de l’utilisation généralisée des biocarburants.
Cependant, en raison du réchauffement climatique et du déclin de la biodiversité,La production alimentaire dans le monde est extrêmement sensible aux changements environnementaux et le développement est inégal selon les régions.

Figure 1 : Carte de la production mondiale de céréales 2020
On peut constater que la Chine, les États-Unis, l’Inde et le Brésil sont les principales régions productrices de céréales.La production alimentaire dans l’hémisphère sud est relativement faible. De plus, en raison de la faible productivité agricole dans l’hémisphère sud, sa production alimentaire est difficile à mesurer avec précision.Il est donc difficile pour nous d’évaluer efficacement la productivité agricole locale, et encore moins de fournir des moyens efficaces pour augmenter la production.
Il existe actuellement trois méthodes couramment utilisées pour les statistiques de production céréalière, notamment l’auto-déclaration, les mesures réelles et les statistiques de télédétection.Les deux premières méthodes sont difficiles à promouvoir à grande échelle, tandis que l’utilisation de la technologie de télédétection sera limitée par le niveau scientifique et technologique local.
À cette fin, des chercheurs de l’Université de Kyoto ont utilisé des réseaux de neurones convolutifs (CNN) pour analyser des photos de terres agricoles prises sur place et ont ensuite compté la production céréalière locale. Les résultats montrent queLe modèle CNN peut compter rapidement et avec précision les rendements du riz au stade de la récolte et à maturité tardive dans différentes conditions d'éclairage.Ce résultat a été publié dans Plant Phenomics.

Lien vers l'article :
https://spj.science.org/doi/10.34133/plantphenomics.0073
Procédures expérimentales
1. Créer une base de données:Photos de la canopée du riz + rendement des grains
Les chercheurs ont recueilli des photos des rendements du riz et des céréales dans 20 fermes réparties dans sept pays. Lorsque le riz était mûr, un appareil photo numérique a été utilisé pour photographier verticalement vers le bas à une hauteur de 0,8 à 0,9 m au-dessus de la canopée du riz afin d'obtenir une image de 1 m.2 Photo RVB du riz.
Remarque : La canopée du riz est la couche supérieure de branches et de feuilles de riz denses et constitue la partie principale de la plante pour la photosynthèse.
Ils ont ensuite modifié l'angle de prise de vue, l'heure et la période, et dans certaines expériences, ils ont retiré les inflorescences de riz une par une pour explorer le mécanisme du modèle CNN dans la prédiction du rendement.Au final, ils ont obtenu 22 067 photos RVB de 462 variétés de riz provenant de 4 820 lieux de prise de vue.
Le rendement en grains dans l'expérience était le rendement en grains grossiers, incluant le poids total des grains de riz remplis et vides. Le rendement statistique en grains se situe entre 0,1 t/ha (tonnes par hectare) et 16,1 t/ha, montrant une distribution normale, avec un rendement moyen d'environ 5,8 t/ha.

Figure 2 : Image de la canopée du riz et distribution du rendement en grains
A : Répartition de la production de céréales secondaires dans sept pays ;
B : Diagramme circulaire de la production moyenne de céréales secondaires dans différents pays ;
C : Image du riz avec le rendement en grains grossiers le plus élevé ;
D : Image du riz avec le rendement en grains grossiers le plus faible.
2. Prévisions de production:Photos de la canopée + CNN → Production alimentaire
Le modèle CNN, la fonction de perte et l'optimiseur sont déployés à l'aide du langage Python et du framework PyTorch. Ensuite, les chercheurs ont calculé la perte de validation et l’erreur quadratique moyenne relative (rRMSE) lorsque la formation du modèle a été terminée en combinant différentes tailles de lots et taux d’apprentissage.La taille de lot optimale (32) et le taux d'apprentissage (0,0001) du modèle ont été obtenus.
Le modèle CNN comporte 5 couches convolutives dans le flux principal (MS) et 4 couches convolutives dans le flux de ramification (BS).Les couches de regroupement du modèle incluent la couche de regroupement moyenne (AveragePooling) et la couche de regroupement maximale (MaxPooling). La fonction d'activation est principalement l'unité linéaire rectifiée (ReLU), et l'unité linéaire exponentielle (ELU) est utilisée dans certaines parties.Enfin, MS et BS sont combinés et le rendement en grains estimé est émis via la couche ReLU.

Figure 3 : Diagramme du modèle CNN
Le modèle CNN a une forte capacité à distinguer les images.Lorsque l'espacement d'échantillonnage au sol (GSD, la distance réelle correspondant à chaque pixel de la photo, qui est opposée à la résolution) est de 0,2 cm/pixel, le coefficient de corrélation R entre le résultat de prédiction du modèle CNN et le résultat réel est2 Au-dessus de 0,65. Même si le GSD augmente à 3,2 cm/pixel, le R2 Il peut également être maintenu au-dessus de 0,55.

Figure 4 : Relation entre les résultats de prédiction du modèle CNN et GSD
A : La relation entre le R2 du modèle CNN et le GSD des photos de l'ensemble de validation et de l'ensemble de test ;
B : Nuage de points de la sortie prévue et de la sortie réelle du modèle CNN ;
C & D : Photos schématiques de GSD de 0,2 cm/pixel et 3,2 cm/pixel.
De plus, les chercheurs ont testé le modèle CNN en utilisant les données de l’ensemble de prédiction. Le modèle CNN peut distinguer la différence de rendement du riz entre Takanari et Koshihikari à Tokyo, et les données prédites sont proches des données réelles.

Figure 5 : Rendement réel (A) et rendement prévu (B) du riz Gaocheng et du riz Koshihikari
L’équipe a ensuite bloqué les images pour explorer le mécanisme par lequel le modèle CNN analysait les images et prédisait la production alimentaire. Ils ont bloqué des zones spécifiques des photos avec des blocs gris et ont calculé la différence de rendement prédite par le modèle CNN avant et après le blocage.

Figure 6 : Schéma de principe de l'expérience d'occlusion
A : Photo avant occlusion ;
B : Photo après occlusion ;
C : Le poids des différentes zones de la photo sur le rendement prédit.
Les résultats ont montré que le rendement en grains était positivement corrélé au nombre d’inflorescences de riz et négativement corrélé à la proportion d’éléments tels que les tiges, les feuilles et le sol dans l’image.
Les chercheurs ont donc vérifié le rôle de l’inflorescence dans la prédiction du rendement grâce à des expériences d’élimination des inflorescences. Ils ont cueilli deux inflorescences de chaque plant de riz, ont pris des photos et ont compté le rendement en grains grossiers jusqu'à ce que toutes les inflorescences soient cueillies.

Figure 7 : Expérience d'élimination des inflorescences et résultats
A : Schéma de l’expérience d’élimination des inflorescences ;
B : Photographie après retrait des inflorescences ;
C : Graphique linéaire de la production attendue et de la production réelle ;
D : Relation entre le rendement attendu et le rendement réel lors de l'élimination des inflorescences.
À mesure que le nombre d’inflorescences diminuait, les résultats de prédiction du rendement du modèle CNN continuaient de diminuer, pour finalement tomber à 1,6 t/ha.Cette expérience montre que le modèle CNN juge principalement le rendement en grains en fonction du nombre d'inflorescences sur la photo.
3. Robustesse:Angle, heure et période de la photo
Après avoir vérifié la capacité du modèle CNN à prédire la production céréalière,Les chercheurs ont varié les angles, les heures et les périodes de prise de vue pour explorer la robustesse du modèle CNN dans différentes conditions.
Les photos ont été prises sous des angles compris entre 20° et 90°, avec un intervalle de test de 10°.Les résultats montrent que la précision de prédiction du modèle CNN augmente avec l’augmentation de l’angle de prise de vue.Lorsque l’erreur de tir est de 20°, le résultat de prédiction du modèle CNN est de -3,7-2,4 t/ha. Lorsque l'angle de tir était de 60°, l'erreur de prédiction était comprise entre -0,45 et 2,44 t/ha, ce qui était proche du résultat de prédiction à 90°.

Figure 8 : Test d'angle de prise de vue et résultats
A : Schéma de principe de l’expérience d’angle de prise de vue ;
B : Photos prises sous différents angles de prise de vue ;
C : La différence entre le rendement prévu et le rendement réel à partir de photos prises sous différents angles.
La caméra a ensuite été placée dans une position fixe pour prendre une photo des terres agricoles toutes les 30 minutes afin d'explorer l'effet du temps de prise de vue sur le modèle CNN.Les résultats montrent que même si l’environnement d’éclairage a changé, les résultats de prédiction du modèle CNN pour les photos prises toute la journée sont fondamentalement stables.

Figure 9 : Test de temps de tir et résultats
A : Schéma de principe de l’expérience du temps de prise de vue ;
B : Photos prises à différents moments de prise de vue ;
C : Le rendement de prédiction du modèle CNN pour les photos prises à différents moments.
Enfin, les chercheurs ont exploré l’impact de la période de tournage sur les résultats de prédiction du modèle CNN.Après l'épiaison du riz 50%, ils se sont rendus chaque semaine dans les champs pour recueillir des photos et les analyser à l'aide du modèle CNN. Au début de la maturité du riz, le rendement prévu par le modèle CNN est inférieur au rendement réel au moment de la récolte car l'inflorescence n'est pas encore complètement mature.
Au fil du temps, les prédictions du modèle CNN se rapprochent progressivement de la production réelle. Quatre semaines après l'épiaison, les résultats de prédiction du modèle CNN étaient fondamentalement stables et proches du rendement réel du 50%.

Figure 10 : Tests et résultats pendant le tournage
A : Photos prises à différents moments de prise de vue, DAH signifie jours après l'épiaison, DBH signifie jours avant la récolte ;
B : Résultats de prédiction du modèle CNN pour des photos prises à différents moments.
Les résultats ci-dessus montrent collectivement que le modèle CNN peut analyser avec précision les photos de terres agricoles prises sous différents angles de prise de vue, à différents moments et à différentes périodes, et obtenir des résultats de prédiction de rendement stables. Les modèles CNN sont robustes.
Agriculture intelligente : l'IA aide à la planification agricole
Selon les Nations Unies, la population mondiale atteindra environ 9,1 milliards d’habitants en 2050. À mesure que la population mondiale augmente et que les revenus augmentent, la demande alimentaire augmente également.
Dans le même temps, l’intensification, la numérisation et l’intelligence de la production agricole ont continuellement augmenté le rendement en grains par mu. De 2000 à 2019, la superficie agricole mondiale a diminué de 3%, tandis que la production des principales cultures a augmenté de 52%, et la production de fruits et légumes a également augmenté d'environ 20%.
L’utilisation d’équipements professionnels tels que de grandes moissonneuses et des drones permet aux agriculteurs de planifier leurs terres agricoles avec précision et commodité. Les technologies telles que le Big Data et l’Internet des objets aident les agriculteurs à percevoir les conditions des terres agricoles en temps réel et peuvent également ajuster automatiquement l’environnement à l’intérieur de la serre. Les prévisions météorologiques précoces utilisant l’apprentissage profond et les grands modèles peuvent prévenir les phénomènes météorologiques extrêmes avant qu’ils ne se produisent et atténuer le problème de l’agriculture traditionnelle qui dépend de la météo pour sa subsistance.

Figure 11 : Schéma d'un système d'agriculture intelligente
Cependant, en 2021, le nombre de personnes touchées par la faim dans le monde a augmenté d’environ 46 millions par rapport à l’année précédente, pour atteindre 828 millions.Les problèmes d’une production agricole déséquilibrée et d’un système imparfait existent toujours et sont encore plus importants.
Grâce à l’IA, nous pouvons élaborer de meilleurs plans pour le développement agricole local.Promouvoir le développement équilibré de la production agricole mondiale et apporter une réponse satisfaisante à la résolution du problème de la faim dans le monde.
Liens de référence :
[1] https://www.fao.org/documents/card/en/c/cc2211en
[2] https://www.deccanherald.com/opinion/smart-farming-tech-new-age-700994.html
Cet article a été publié pour la première fois sur la plateforme publique HyperAI WeChat~