2 个月前

基于深度描述符变换的无监督对象发现与共定位

Xiu-Shen Wei; Chen-Lin Zhang; Jianxin Wu; Chunhua Shen; Zhi-Hua Zhou
基于深度描述符变换的无监督对象发现与共定位
摘要

随着计算机视觉和机器学习应用的迅速扩展,可重用模型设计变得越来越重要。本文重点关注预训练深度卷积模型的可重用性。具体而言,不同于将预训练模型视为特征提取器,我们揭示了卷积层下的更多宝藏,即卷积激活可以作为图像共定位问题中常见物体的检测器。为此,我们提出了一种简单而有效的方法——深度描述符转换(Deep Descriptor Transforming, DDT),用于评估描述符之间的相关性,进而获得类别一致的区域,从而在一组未标记的图像中准确地定位常见物体,即无监督对象发现。实证研究验证了所提出的DDT方法的有效性。在基准图像共定位数据集上,DDT显著优于现有的最先进方法。此外,DDT还表现出对未见过类别良好的泛化能力和处理噪声数据的鲁棒性。除此之外,DDT还可以用于从网络图像中获取有效的外部数据源,以提高图像识别和目标检测的性能。