2 个月前

细粒度图像分类中输出嵌入的评估

Zeynep Akata; Scott Reed; Daniel Walter; Honglak Lee; Bernt Schiele
细粒度图像分类中输出嵌入的评估
摘要

近年来,随着大规模图像数据集的可用,图像分类技术取得了显著进展。然而,细粒度分类仍然是一个主要挑战,因为大量细粒度类别需要高昂的标注成本。本项目表明,即使没有标记的训练数据,也可以在这些类别上实现令人信服的分类性能。通过给定的图像和类别嵌入(embeddings),我们学习了一个兼容性函数,使得匹配的嵌入得分高于不匹配的嵌入;零样本图像分类的过程是找到具有最高联合兼容性得分的标签。我们使用最先进的图像特征,并专注于不同的监督属性和非监督输出嵌入(output embeddings),这些输出嵌入要么从层次结构中派生,要么从未标记的文本语料库中学习得到。我们在“带属性的动物”(Animals with Attributes)和“加州理工-UCSD鸟类”(Caltech-UCSD Birds)数据集上建立了显著改进的新基准。最令人鼓舞的是,我们证明了完全非监督的输出嵌入(从维基百科学习并用细粒度文本改进)可以取得令人信服的结果,甚至超过了之前的监督方法的最佳水平。通过结合不同的输出嵌入,我们进一步提高了结果。