摘要
深度神经网络的最新进展推动了基于图像的垃圾分类研究的显著发展。现有方法主要依赖迁移学习以实现当前最先进的分类性能。本文提出一种新方法,通过引入位置信息、时间维度的交通流量强度等元数据字段,辅助现有的基于图像的分类器。为此,我们构建了ISBNet数据集,该数据集包含889张图像及其关联的元数据,涵盖五大类别(纸张、塑料、易拉罐、利乐包及垃圾填埋物)。基于该数据集,我们开发了ThanosNet模型,其性能优于当前主流的基于图像的垃圾分类模型。尽管ISBNet数据集仅针对单一用户群体进行采集,但本文所提出的通用方法论可广泛适用于多种消费场景。