ViTaL: 시각 변환기와 선형 투영을 이용한 특성 감소를 통한 잎사귀 이미지에서의 자동 식물 병해진단을 위한 고급 프레임워크

본 논문은 식물 잎 이미지에서 질병을 자동으로 식별하기 위한 강건한 프레임워크를 제안한다. 이 프레임워크는 질병 인식 정확도를 향상시키기 위해 여러 핵심 단계를 포함하고 있다. 전처리 단계에서는 중요한 이미지 세부 정보의 손실을 최소화하면서도 계산 효율성을 보장하기 위해 썸네일 리사이징 기술을 활용한다. 특징 추출 전에 이미지 데이터를 표준화하기 위한 정규화 절차가 적용된다. 특징 추출은 최신 이미지 분석 기법인 비전 트랜스포머(Vision Transformer)를 기반으로 한 새로운 프레임워크를 통해 수행된다. 또한, 선형 투영(Linear Projection) 계층과 �ブロック 단위 선형 투영(Blockwise Linear Projections)을 추가한 프레임워크의 대안 버전도 탐구된다. 이러한 비교 분석을 통해 선형 투영이 특징 추출 및 전체 모델 성능에 미치는 영향을 평가할 수 있다. 제안된 프레임워크의 효과를 평가하기 위해 다양한 컨볼루션 신경망(Convolutional Neural Network, CNN) 아키텍처를 활용하여 선형 투영이 주요 평가 지표에 미치는 영향을 종합적으로 검토하였다. 연구 결과는 제안된 프레임워크의 효과성을 입증하며, 최고 성능을 보인 모델은 헤밍 손실(Hamming loss) 0.054를 달성하였다. 더불어, 방사형 방식으로 병변 잎을 스캔할 수 있도록 특별히 설계된 새로운 하드웨어 구조를 제안한다. 이 하드웨어 구현은 메모리가 제한된 환경에서도 작동할 수 있도록 라즈베리 파이 컴퓨트 모듈(Raspberry Pi Compute Module)을 사용하여 실용성과 경제성을 확보하였다. 이러한 혁신적인 하드웨어 솔루션은 제안된 자동 질병 식별 시스템의 전반적인 실현 가능성과 접근성 향상에 기여한다. 본 연구는 농업 분야에 있어 식물 질병의 조기 탐지 및 관리에 대한 귀중한 통찰과 도구를 제공함으로써, 향후 작물 수확량 증대와 식량 안보 향상에 기여할 수 있는 가능성을 제시한다.