2 个月前
基于对比预测编码的数据高效图像识别
Olivier J. Hénaff; Aravind Srinivas; Jeffrey De Fauw; Ali Razavi; Carl Doersch; S. M. Ali Eslami; Aaron van den Oord

摘要
人类观察者可以从少数几个样本中学习识别新的图像类别,而使用人工系统实现这一点仍然是一个未解决的挑战。我们假设,数据高效的识别能力是由那些使得自然信号变化更加可预测的表示所支持的。因此,我们重新审视并改进了对比预测编码(Contrastive Predictive Coding),这是一种用于学习此类表示的无监督目标函数。这一新实现生成的特征在ImageNet数据集上支持最先进的线性分类准确性。当用作深度神经网络非线性分类的输入时,这种表示使我们能够比直接基于图像像素训练的分类器减少2-5倍的标签使用量。最后,这种无监督表示显著提高了在PASCAL VOC数据集上的目标检测迁移学习性能,超过了完全监督预训练的ImageNet分类器。