17日前

ViTaL:視覚変換器と線形射影を用いた特徴次元削減による葉画像における自動植物病害識別向け高度なフレームワーク

Abhishek Sebastian, Annis Fathima A, Pragna R, Madhan Kumar S, Yaswanth Kannan G, Vinay Murali
ViTaL:視覚変換器と線形射影を用いた特徴次元削減による葉画像における自動植物病害識別向け高度なフレームワーク
要約

本論文では、植物の葉画像における病害の自動識別を実現する堅牢なフレームワークを提案する。このフレームワークは、病害認識の精度を向上させるために複数の主要な段階を統合している。前処理段階では、画像の詳細情報を最小限に損ないつつ計算効率を確保するため、サムネイルリサイズ技術が採用されている。特徴量抽出の前段階として、画像データの標準化処理が施され、一貫性のある入力データの構築が行われる。特徴量抽出は、画像解析分野における最先端技術であるVision Transformer(視覚変換器)を基盤とする新しいフレームワークにより実現される。さらに、線形投影層を追加したバージョンや、ブロック単位の線形投影を導入したバリエーションも検討された。これらの比較分析を通じて、線形投影が特徴量抽出およびモデル全体の性能に与える影響を評価している。提案フレームワークの有効性を検証するため、多様な畳み込みニューラルネットワーク(CNN)アーキテクチャを用いて評価が行われ、線形投影が主な評価指標に及ぼす影響を包括的に分析した。その結果、提案フレームワークの有効性が実証され、最高性能を示したモデルはハミング損失(Hamming loss)0.054を達成した。さらに、全方位的に病害葉をスキャンすることを想定した新しいハードウェア設計も提案する。このハードウェア実装では、メモリ制約が厳しい環境に対応するため、Raspberry Pi Compute Moduleを採用しており、実用性とコストパフォーマンスの両立を実現している。本研究で開発された革新的なハードウェアソリューションは、提案する自動病害識別システムの実現可能性とアクセス可能性を大幅に向上させる。本研究は、農業分野において植物病害の早期検出および管理に向けた貴重な知見とツールを提供し、作物収量の向上および食料安全保障の強化に貢献するものである。