深層学習モデル「LKNet」が生育段階を問わず高精度な稲の穂粒数カウントを実現
中国農業科学院のSong Chen研究チームが開発した深層学習モデル「LKNet」が、稲の花序(花穂)数の正確な計数において新たな基準を確立した。本モデルは、大キーネル畳み込みブロック(LKconv)と新開発の損失関数を統合し、花穂の重なり、アノテーションバイアス、生育段階による構造変化といった課題に対応。無人航空機(UAV)画像や複数の作物データセットを用いた評価で、高い精度とロバスト性を実証した。 従来の花穂数計数手法は、検出ベース、密度ベース、位置ベースのアプローチに分かれるが、それぞれ限界がある。検出モデルは密な冠層で精度が低下し、密度ベースは背景干渉に敏感。位置ベースのP2PNetは解釈しやすいものの、受容野の制限とラベル誤差の影響を受けやすい。LKNetは、P2PNetの枠組みを拡張し、動的な受容野適応と柔軟な損失関数を導入することで、これらの課題を克服した。 SHTech PartAの高密度集団データセットでは、MAE 48.6、RMSE 77.9と、P2PNetやPSDNN_CHatを上回る性能を示した。PartBデータセットでも最先端レベルの精度を達成。特に稲の花穂計数においては、RMSE 1.76、R² 0.965という高精度を実現。マウズの穂先計数に優れるモデルと比較しても、稲の多様な形態に適応する強みを発揮した。 7メートルの高さから取得した稲冠層データセットでも、密生型・中間型・開散型の花穂すべてでR² 0.98以上を達成。ただし、生育後期では被覆や形態変化により精度がわずかに低下した。アブレーション研究により、LKconvの導入がRMSEを2.821から0.846まで低減し、パラメータ数も約50%削減する効果が確認された。特に、アテンション機構を備えた順次大キーネルモジュールが最良の性能(R² 0.993)を示した。 可視化結果から、LKNetは複雑なシーンでも花穂の位置をより広範かつ正確に捉える能力を有しており、背景ノイズの抑制も優れている。本研究は、農業における収量予測や品種選抜の形態解析など、手作業によるアノテーションを不要とする高スループットなソリューションの実現を示した。LKNetは、UAVを活用した精密農業における花穂計数の新たな標準となり得る。