4 个月前
噪声数据在细粒度识别中的不合理有效性
Jonathan Krause; Benjamin Sapp; Andrew Howard; Howard Zhou; Alexander Toshev; Tom Duerig; James Philbin; Li Fei-Fei

摘要
当前细粒度识别的方法通常包括以下步骤:首先,招募专家对图像数据集进行标注,有时还会收集以部件注释和边界框形式的更结构化的数据。其次,利用这些数据训练模型。为了实现细粒度识别的目标,我们提出了一种替代方法,该方法利用网络上的免费但嘈杂的数据以及简单且通用的识别方法。这种方法在性能和可扩展性方面都具有优势。我们在四个细粒度数据集上展示了其有效性,无需手动收集任何标签即可显著超越现有最先进水平,并进一步展示了将该方法扩展到超过10,000个细粒度类别的初步结果。定量结果显示,在CUB-200-2011、Birdsnap、FGVC-Aircraft和Stanford Dogs数据集上,我们的方法分别达到了92.3%、85.4%、93.4%和80.8%的top-1准确率,而未使用它们的标注训练集。我们将这种方法与用于扩展细粒度数据集的主动学习方法进行了比较。