2 个月前

不变信息聚类在无监督图像分类和分割中的应用

Xu Ji; João F. Henriques; Andrea Vedaldi
不变信息聚类在无监督图像分类和分割中的应用
摘要

我们提出了一种新颖的聚类目标,该目标仅基于未标记的数据样本从零开始学习神经网络分类器。模型发现的聚类能够准确匹配语义类别,在涵盖图像分类和分割的八个无监督聚类基准测试中取得了最先进的结果。这些基准测试包括STL10、ImageNet的无监督变体以及CIFAR10,在这些测试中,我们的方法分别以6.6和9.5个百分点的绝对优势显著超越了最接近的竞争者。该方法不仅限于计算机视觉领域,适用于任何配对数据集样本;在我们的实验中,我们通过随机变换从每张图像中获得一对样本。训练后的网络直接输出语义标签,而不是需要外部处理才能用于语义聚类的高维表示。目标仅仅是最大化每对样本之间的类别分配的互信息。该方法易于实现,并且严格基于信息理论,这意味着我们可以轻松避免其他聚类方法容易陷入的退化解。除了完全无监督模式外,我们还测试了两种半监督设置。第一种在STL10分类任务上达到了88.8%的准确率,超过了所有现有方法(无论是有监督、半监督还是无监督)的新全球最高水平。第二种展示了在标签覆盖率减少90%时的鲁棒性,这对于希望利用少量标签的应用具有重要意义。相关代码已发布在github.com/xu-ji/IIC。