
초록
우리는 식물 질병 탐지용 딥러닝 모델 훈련에 널리 사용되는 PlantVillage 데이터셋의 활용에 대해 조사한 결과를 보고한다. 우리는 PlantVillage 이미지 배경에서 단지 8개의 픽셀만을 사용하여 머신러닝 모델을 훈련시켰다. 그 결과, 보류된 테스트 세트에서 모델은 49.0%의 정확도를 달성하였으며, 무작위 추측 정확도인 2.6%보다 훨씬 높은 수준이었다. 이 결과는 PlantVillage 데이터셋이 레이블과 상관된 노이즈를 포함하고 있으며, 딥러닝 모델이 이러한 편향을 쉽게 이용해 예측을 수행할 수 있음을 시사한다. 이 문제를 완화하기 위한 가능한 접근 방안에 대해 논의한다.