11일 전

PlantVillage 데이터셋 내재된 편향 탐색

Mehmet Alican Noyan
PlantVillage 데이터셋 내재된 편향 탐색
초록

우리는 식물 질병 탐지용 딥러닝 모델 훈련에 널리 사용되는 PlantVillage 데이터셋의 활용에 대해 조사한 결과를 보고한다. 우리는 PlantVillage 이미지 배경에서 단지 8개의 픽셀만을 사용하여 머신러닝 모델을 훈련시켰다. 그 결과, 보류된 테스트 세트에서 모델은 49.0%의 정확도를 달성하였으며, 무작위 추측 정확도인 2.6%보다 훨씬 높은 수준이었다. 이 결과는 PlantVillage 데이터셋이 레이블과 상관된 노이즈를 포함하고 있으며, 딥러닝 모델이 이러한 편향을 쉽게 이용해 예측을 수행할 수 있음을 시사한다. 이 문제를 완화하기 위한 가능한 접근 방안에 대해 논의한다.

PlantVillage 데이터셋 내재된 편향 탐색 | 최신 연구 논문 | HyperAI초신경