2 个月前

WILDCAT:用于图像分类、逐点定位与分割的弱监督深度ConvNet学习

{Nicolas Thome, Taylor Mordan, Matthieu Cord, Thibaut Durand}
WILDCAT:用于图像分类、逐点定位与分割的弱监督深度ConvNet学习
摘要

本文提出了一种名为WILDCAT的深度学习方法,该方法旨在联合实现图像区域的对齐以获得空间不变性,同时学习高度局部化的特征。我们的模型仅使用全局图像标签进行训练,专注于三大主要视觉识别任务:图像分类、弱监督目标定位以及语义分割。WILDCAT在三个关键层面扩展了当前最先进的卷积神经网络(Convolutional Neural Networks):一是采用全卷积网络(Fully Convolutional Networks)以保持空间分辨率;二是显式地在网络结构中设计与不同类别模态相关的局部特征;三是提出一种新的特征池化方式,用于生成弱监督训练所需的全局图像预测。大量实验结果表明,该模型在性能上显著优于现有最先进方法。