HyperAIHyperAI
vor 11 Tagen

Aufdeckung von Bias im PlantVillage-Datensatz

Mehmet Alican Noyan
Aufdeckung von Bias im PlantVillage-Datensatz
Abstract

Wir berichten über unsere Untersuchung zur Verwendung des populären PlantVillage-Datensatzes zur Schulung von Deep-Learning-Modellen für die Pflanzenkrankheitsdetektion. Wir trainierten ein maschinelles Lernmodell ausschließlich anhand von nur 8 Pixeln aus den Hintergründen der PlantVillage-Bilder. Das Modell erreichte eine Genauigkeit von 49,0 % auf dem getrennten Testset, deutlich über der Zufallsgenauigkeit von 2,6 %. Dieser Befund zeigt, dass der PlantVillage-Datensatz Rauschen enthält, das mit den Labels korreliert, und dass Deep-Learning-Modelle dieses Bias leicht ausnutzen können, um Vorhersagen zu treffen. Mögliche Ansätze zur Linderung dieses Problems werden diskutiert.