17 天前

ViTaL:一种基于视觉Transformer与线性投影特征降维的先进框架,用于叶片图像中的植物病害自动识别

Abhishek Sebastian, Annis Fathima A, Pragna R, Madhan Kumar S, Yaswanth Kannan G, Vinay Murali
ViTaL:一种基于视觉Transformer与线性投影特征降维的先进框架,用于叶片图像中的植物病害自动识别
摘要

本文提出了一种用于植物叶片图像中疾病自动识别的鲁棒性框架。该框架包含多个关键阶段,旨在提升疾病识别的准确性。在预处理阶段,采用缩略图重采样技术对图像进行尺寸调整,在最大限度保留关键图像细节的同时,保障计算效率。随后,通过归一化处理对图像数据进行标准化,为后续特征提取做好准备。特征提取基于一种新型视觉Transformer(Vision Transformer)框架实现,该方法代表了当前图像分析领域的前沿技术。此外,本文还探索了在该框架基础上引入线性投影层及分块线性投影(blockwise linear projections)的变体结构。通过对比分析,评估了线性投影对特征提取效果及整体模型性能的影响。为全面验证所提框架的有效性,研究采用了多种卷积神经网络(Convolutional Neural Network, CNN)架构进行实验,从而系统评估线性投影对关键评价指标的影响。实验结果表明,所提出框架具有显著成效,最优模型在Hamming损失(Hamming loss)指标上达到0.054。此外,本文还提出一种专为全方位扫描病叶而设计的新型硬件方案。该硬件系统基于Raspberry Pi Compute Module构建,特别适用于低内存配置环境,兼顾实用性与成本效益。这一创新的硬件设计显著提升了所提自动化疾病识别系统的可行性与可及性。本研究为农业领域提供了重要的理论支持与实用工具,有助于实现植物病害的早期发现与有效管理,有望提升农作物产量,推动粮食安全水平的进一步提高。