11 天前

重新思考弱监督目标定位的路径

Chen-Lin Zhang, Yun-Hao Cao, Jianxin Wu
重新思考弱监督目标定位的路径
摘要

弱监督目标定位(Weakly Supervised Object Localization, WSOL)旨在仅利用图像级标签实现目标定位。以往的方法通常通过特征图与分类权重,间接利用图像级标注来定位目标。本文指出,弱监督目标定位应被划分为两个独立部分:类别无关的目标定位与目标分类。在类别无关的目标定位阶段,应采用不依赖类别的方法生成噪声伪标注,并在此基础上进行边界框回归,而无需使用类别标签。为此,我们提出了一种新的方法——伪监督目标定位(Pseudo Supervised Object Localization, PSOL),作为解决WSOL问题的新范式。所提出的PSOL模型在不同数据集之间具有良好的迁移能力,无需微调即可适用。借助生成的伪边界框,我们在ImageNet数据集上实现了58.00%的定位准确率,在CUB-200数据集上达到74.97%的定位准确率,显著优于此前的模型。

重新思考弱监督目标定位的路径 | 最新论文 | HyperAI超神经