* 该数据集支持在线使用,点击此处跳转。
该数据集包含 15,000 张图像(每张 256×256 像素),涵盖 30 个不同类别的各种可回收材料、一般垃圾和家居用品。该数据集每个类别有 500 张图像,每个子类别有 250 张图像,为垃圾分类和回收领域的研究和开发提供了丰富多样的资源。通过提供大量高质量图像,该数据集旨在支持创建强大而准确的垃圾分类和分类系统。
数据集结构
数据集采用分层文件夹结构,以确保轻松导航和访问。主文件夹名为「image」,其中包含代表特定废物类别或项目的子文件夹。这些子文件夹名称作为其各自类别的标签,方便研究人员和开发人员识别和利用图像以满足他们的特定需求。
您必须手动将数据集拆分为测试、训练和验证。请参阅可回收和家庭垃圾分类代码以获取有关如何执行此操作的示例。
在每个类别子文件夹中,有两个不同的文件夹:
default
:此文件夹包含废弃物品的标准或工作室级图像。这些图像清晰且可控地呈现物品,可用于初步训练和测试废弃物分类模型。每个 “默认” 子文件夹包含 250 张图片。
real_world
:此文件夹包含现实场景或环境中的废弃物品图像。这些图像捕捉了各种情况下的物品,例如垃圾箱、地面或杂乱的环境中。现实图像对于评估实际设置中废弃物分类模型的性能和稳健性至关重要。每个「real_world」子文件夹还包含 250 张图片。
数据集中的所有图像均以 PNG 格式提供,确保高质量并与各种图像处理和机器学习库兼容。
废物类别
该数据集涵盖了广泛的废物类别和物品,包括:
- 塑料:此类别包括塑料水瓶、汽水瓶、洗涤剂瓶、购物袋、垃圾袋、食品容器、一次性餐具、吸管和杯盖的图片。这些物品占家庭产生的塑料垃圾的很大一部分,对于回收工作至关重要。
- 纸张和纸板:此类别包括报纸、办公用纸、杂志、纸板箱和纸板包装的图片。这些物品通常可回收利用,在减少森林砍伐和保护自然资源方面发挥着至关重要的作用。
- 玻璃:此类别包括玻璃制成的饮料瓶、食品罐和化妆品容器的图片。玻璃是一种可回收性极高的材料,正确的分类和整理对于有效的回收过程至关重要。
- 金属:此类别包括铝制汽水罐、铝制食品罐、钢制食品罐和气雾罐的图片。金属废物具有回收价值,如果正确识别和分离,可以有效处理。
- 有机垃圾:此类别包括食物垃圾的图片,例如果皮、蔬菜碎、蛋壳、咖啡渣和茶包。有机垃圾可以堆肥或用于生产沼气,从而减轻垃圾填埋场的负担并产生宝贵的资源。
- 纺织品:此类别包括服装和鞋子的图片。纺织废料越来越令人担忧,适当的分类有助于回收利用,减少时尚行业对环境的影响。
请参阅数据集中的各个子文件夹,以获取每个废物类别的具体示例和实例。
数据集的使用和应用
可回收和家庭垃圾分类数据集为研究人员、工程师和环保爱好者提供了广泛的可能性。该数据集的一些潜在用途和应用包括:
- 开发和训练机器学习模型,实现垃圾自动分类和归类。数据集中的各种图像和真实场景使得能够创建稳健而准确的分类模型,这些模型可部署在垃圾管理设施、回收中心和智能垃圾箱中。
- 分析不同废弃物的视觉特征和特性。研究人员可以使用数据集来研究各种废弃物的独特视觉属性,例如颜色、形状、纹理和大小。这种分析有助于开发更高效、更有针对性的废弃物分类算法。
- 比较垃圾分类算法在默认图像和真实图像上的表现。该数据集允许研究人员在受控和现实环境中评估和基准测试其算法的准确性和稳健性。这种比较可以帮助确定不同方法的优缺点,并指导开发更可靠的垃圾分类系统。
- 研究现实场景对垃圾识别准确度的影响。数据集包含现实图像,使研究人员能够研究照明条件、物体遮挡和背景杂乱等因素如何影响垃圾分类模型的性能。这项研究可以促进开发更具弹性和适应性的算法,以应对现实垃圾管理场景中遇到的挑战。