2 个月前

FSS-1000:一种用于少样本分割的1000类数据集

Xiang Li; Tianhan Wei; Yau Pun Chen; Yu-Wing Tai; Chi-Keung Tang
FSS-1000:一种用于少样本分割的1000类数据集
摘要

在过去的几年中,由于大规模人工标注数据集(如PASCAL VOC、ImageNet和COCO)的可用性,深度学习在图像识别领域取得了显著成功。尽管这些数据集涵盖了广泛的物体类别,但仍有许多物体未被包括在内。我们能否在没有大量人工标注的情况下完成相同的任务?本文关注的是少样本目标分割问题,其中训练样本的数量仅限于5个标注示例。为了评估和验证我们的方法性能,我们构建了一个少样本分割数据集FSS-1000,该数据集包含1000个目标类别的像素级真实分割标注。FSS-1000的独特之处在于,它包含了大量之前数据集中从未见过或标注过的物体,例如微小的日用品、商品、卡通角色、标志等。我们使用了标准的骨干网络(如VGG-16、ResNet-101和Inception)构建了基线模型。令人惊讶的是,我们发现使用FSS-1000从零开始训练模型可以达到与使用比FSS-1000大一百多倍的ImageNet预训练权重训练相当甚至更好的结果。我们的方法和数据集既简单又有效,并且可以轻松扩展以学习新目标类别的分割,即使只有少量标注的训练样本。数据集可在https://github.com/HKUSTCV/FSS-1000获取。