国連は、世界の人口は 2050 年に 91 億人に達すると予想され、世界の食料需要は 70% 増加すると予測しています。
しかし、世界の農業の発展には不均一性があるため、多くの地域では穀物生産量を正確に数えることができず、これらの地域で農業発展について合理的な計画を立てることは不可能です。既存の穀物生産量統計手法は普及が難しく、高度な科学技術を必要とします。
この目的を達成するために、京都大学の研究者らは畳み込みニューラル ネットワーク (CNN) を使用して農地の写真を分析し、地域の穀物生産量を効率的かつ正確にカウントし、世界的な農業の発展を促進する新しい方法を提供しました。
著者 | 雪才
編集者 | 三陽
この記事は、HyperAI Super Neural WeChat パブリック プラットフォームで初めて公開されました。~
人口増加、所得の増加、バイオ燃料の普及の影響を受け、世界の食料需要は 2050 年に 70% 増加すると予想されます。
しかし、地球温暖化や生物多様性の減少により、世界中の食料生産は環境変化の影響を非常に受けやすく、開発は地域によって不均一です。
図 1: 2020 年の世界の穀物生産マップ
中国、米国、インド、ブラジルが主な穀物の生産地であることがわかります。南半球の穀物生産量は比較的少ないです。さらに、南半球は農業生産性が低いため、食料生産量を正確に測定することが困難です。したがって、地域の農業生産性を効果的に評価することは困難であり、ましてや生産量を増やすための効果的な手段を提供することは困難です。
現在、一般的に使用されている穀物収量統計手法には、自己申告、実際の伐採測定、リモートセンシング統計の 3 つがあります。最初の 2 つの方法は大規模に推進するのが難しく、リモート センシング技術の使用は地域の科学技術レベルによって制限されます。
この目的を達成するために、京都大学の研究者は畳み込みニューラル ネットワーク (CNN) を使用してその場で撮影された農地の写真を分析し、地元の穀物生産に関する統計を作成しました。結果は次のようになります。CNN モデルは、さまざまな照明条件下で、収穫期および成熟期の米の収量を迅速かつ正確にカウントできます。この成果は『Plant Phenomics』に掲載されました。
論文リンク:
https://spj.science.org/doi/10.34133/plantphenomics.0073
研究者らは、7か国の20の農地から米の写真と穀物の収量を収集した。稲が成熟したら、稲冠上0.8~0.9メートルの高さからデジタルカメラで垂直下方向に撮影し、1メートルの範囲を取得します。2 お米のRGB写真。
注: 稲冠は稲の枝と葉の密集した最上層であり、植物の光合成の主要部分です。
その後、撮影角度、時間、期間を変更し、イネの花序を1つずつ除去するいくつかの実験を行い、CNNモデルの収量予測のメカニズムを調査しました。最終的に、4,820 の撮影場所から 462 種のイネの 22,067 枚の RGB 写真を取得しました。
実験における穀粒収量は、固形米粒と空米粒の合計重量を含む粗粒収量です。統計的に得られた穀物収量は 0.1 t/ha (トン/ヘクタール) ~ 16.1 t/ha で、正規分布を示し、平均収量は約 5.8 t/ha です。
図2:稲冠画像と穀粒収量分布
A: 7 か国の粗粒収量分布。
B: 各国の平均粗粒収量の円グラフ。
C: 粗粒収量が最も高い米の画像。
D: 粗粒収量が最も低い米の画像。
CNN モデル、損失関数、およびオプティマイザーは、Python 言語と PyTorch フレームワークを使用してデプロイされます。その後、研究者らは、異なるバッチ サイズと学習率を組み合わせてモデル トレーニングが完了したときの検証損失と相対二乗平均平方根誤差 (rRMSE) を計算しました。モデルの最適なバッチ サイズ (32) と学習率 (0.0001) が得られました。
CNN モデルには、メイン ストリーム (MS) に 5 つの畳み込み層、分岐ストリーム (BS) に 4 つの畳み込み層があります。モデルのプーリング層には、平均プーリング層 (AveragePooling) と最大プーリング層 (MaxPooling) が含まれます。活性化関数は主に整流線形単位 (ReLU) ですが、一部に指数線形単位 (ELU) が使用されます。最後に、MS と BS がマージされ、ReLU 層を通じて推定穀物収量が出力されます。
図 3: CNN モデルの概略図
CNN モデルは画像に対して強力な分解能を持っています。地上サンプリング間隔 (GSD、解像度ではなく、写真内の各ピクセルに対応する実際の距離) が 0.2 cm/ピクセルの場合、CNN モデルの予測結果と実際の結果の間の相関係数 R2 0.65以上。 GSD が 3.2 cm/pixel に増加しても、モデルの R2 0.55以上を維持することも可能です。
図 4: CNN モデルの予測結果と GSD の関係
A: CNN モデルの R2 と検証セットおよびテスト セットの写真の GSD の間の関係。
B: CNN モデルの予測出力と実際の出力の散布図。
C & D: 0.2 cm/ピクセルと 3.2 cm/ピクセルの GSD の概略写真。
さらに研究者らは、予測セットのデータを使用して CNN モデルをテストしました。 CNN モデルは東京の高成米とコシヒカリの収量差を区別でき、予測データは実際のデータに近いものとなっています。
図5 優良米とコシヒカリの実績収量(A)と予測収量(B)
次に、チームは画像をオクルージョンして、CNN モデルが画像を分析して穀物の収量を予測するメカニズムを調査しました。彼らは、写真の特定の領域を灰色のパッチでブロックし、ブロックの前後での CNN モデルの予測収量の差を計算しました。
図6: オクルージョン実験の模式図
A: ブロックする前の写真。
B: ブロック後の写真。
C: 予測収量に対する写真のさまざまな領域の重み。
その結果、穀物の収量はイネの花序の数と正の相関があり、画像内の茎、葉、地面、その他の要素の割合と負の相関があることがわかりました。
そこで研究者らは、花序の除去実験を通じて、収量予測における花序の役割を検証した。彼らは各稲から 2 つの花序を摘み取り、写真を撮り、すべての花序が除去されるまで穀物の収量を数えました。
図 7: 花序除去実験とその結果
A: 花序除去実験の模式図。
B: 花序を除去した後の写真。
C: 期待される出力と実際の出力の折れ線グラフ。
D: 花序除去中の予想収量と実際の収量の関係。
花序の数が減少するにつれて、CNN モデルの収量予測結果は減少し続け、最終的には 1.6 t/ha まで低下しました。この実験は、CNN モデルが主に写真内の花序の数に基づいて穀物の収量を判断していることを示しています。
CNN モデルの穀物収量を予測する能力を検証した後、研究者らは、撮影角度、時間、期間を変更して、さまざまな条件下での CNN モデルの堅牢性を調査しました。
写真の撮影角度は20°〜90°、テスト間隔は10°です。結果は、カメラ角度が増加するにつれて CNN モデルの予測精度が向上することを示しています。撮影誤差が 20°の場合、CNN モデルの予測結果は -3.7 ~ 2.4 t/ha となります。撮影角度が 60°の場合、予測誤差は -0.45 ~ 2.44 t/ha となり、90°の場合の予測結果に近づきます。
図 8: 撮影角度テストと結果
A: 撮影角度実験の模式図。
B: さまざまな撮影角度から撮影した写真。
C: さまざまな撮影角度からの写真の予測出力と実際の出力の差。
その後、カメラを固定位置に設置し、30 分ごとに農地の写真を撮影し、撮影時間が CNN モデルに与える影響を調査しました。結果は、照明環境が変化しても、終日の写真に対する CNN モデルの予測結果は基本的に安定していることを示しています。
図 9: 撮影時間のテストと結果
A: 撮影時間実験の模式図。
B: 異なる撮影時間に撮影された写真。
C: さまざまな撮影時間における写真の CNN モデルの予測収量。
最後に、研究者らは、CNN モデルの予測結果に対する撮影期間の影響を調査しました。イネ 50% は出穂後、毎週農地に出向いて写真を収集し、CNN モデルで分析します。イネの成熟の初期段階では、この時点では花序が完全に成熟していないため、CNN モデルの予測収量は収穫時の実際の収量よりも低くなります。
時間が経つにつれて、CNN モデルの予測結果は徐々に実際の生産に近づいていきます。 50% の進行から 4 週間後、CNN モデルの予測結果は基本的に安定しており、実際の収量に近かったです。
図 10: 撮影期間中のテストと結果
A: 異なる撮影時期に撮影された写真。DAH は出穂後の日数を表し、DBH は収穫までの日数を表します。
B: 異なる時間に撮影された写真に対する CNN モデルの予測結果。
上記の結果は、CNN モデルがさまざまな撮影角度、時間、期間で取得された農地写真を正確に分析し、安定した収量予測結果を取得できることを共同で示しています。 CNN モデルは堅牢です。
国連によると、世界人口は2050年に約91億人に達すると予想されています。世界の人口が増加し、所得が増加するにつれて、人々の食料需要も増加しています。
同時に、農業生産の強化、デジタル化、インテリジェンスにより、エーカー当たりの穀物生産量は継続的に増加しています。 2000年から2019年までに、世界の農地面積は3%減少したが、主要作物の生産量は52%増加し、果物と野菜の生産量も約20%増加した。
大型収穫機やドローンなどの専門機材を活用し、正確かつ便利に農地計画を立てることができます。ビッグデータやモノのインターネットなどのテクノロジーにより、農家は農地の状況をリアルタイムで認識できるようになり、温室内の環境を自動的に調整することもできます。ディープラーニングと大規模モデルは、事前に天候を予測して異常気象を事前に防ぎ、天候に依存した伝統的な農業の問題を軽減することができます。
図 11: スマート農業システムの概略図
しかし、2021年現在、世界の飢餓の影響を受ける人の数は前年比約4,600万人増加し、8億2,800万人に達しています。不均衡な農業生産と不完全なシステムの問題は依然として存在しており、さらに顕著になっています。
AI の助けを借りて、地域の農業開発のためのより良い計画を立てることができます。世界の農業生産のバランスの取れた発展を促進し、世界の飢餓問題に満足のいく答えを提供する。
参考リンク:
[1] https://www.fao.org/documents/card/en/c/cc2211en
[2] https://www.deccanherald.com/opinion/smart-farming-tech-new-age-700994.html
この記事は、HyperAI Super Neural WeChat パブリック プラットフォームで初めて公開されました。~