11 天前

揭示PlantVillage数据集中的偏差

Mehmet Alican Noyan
揭示PlantVillage数据集中的偏差
摘要

我们报告了关于利用广为使用的PlantVillage数据集训练基于深度学习的植物病害检测模型的研究。实验中,我们仅使用PlantVillage图像背景中的8个像素作为输入,训练了一个机器学习模型。该模型在保留的测试集上取得了49.0%的准确率,显著高于随机猜测的2.6%基准水平。这一结果表明,PlantVillage数据集中存在与标签相关联的噪声,而深度学习模型能够轻易利用此类偏差进行预测。文中还讨论了缓解该问题的若干可能方法。

揭示PlantVillage数据集中的偏差 | 最新论文 | HyperAI超神经