4 个月前
利用半监督学习改进地标定位
Sina Honari; Pavlo Molchanov; Stephen Tyree; Pascal Vincent; Christopher Pal; Jan Kautz

摘要
我们提出了两种技术,以提高部分标注数据集中的图像地标定位精度。我们的主要目标是在仅有少量数据子集提供精确地标位置的情况下,充分利用与这些地标相关的分类或回归任务中更为丰富的类别标签。首先,我们提出了一种顺序多任务框架,并通过一种用于地标定位的架构来探索这一框架,其中类别标签作为辅助信号指导未标注数据上的地标定位。我们方法的一个关键方面是错误可以通过完整的地标定位模型进行反向传播。其次,我们提出并探索了一种基于图像变换预测等变地标的无监督学习技术。我们展示了这些技术显著提高了地标的预测精度,并且即使在数据集中只有很小一部分具有地标标签时也能学习到有效的检测器。我们在两个玩具数据集和四个真实数据集上进行了实验,涉及手部和面部的地标定位,并在两个野外数据集上报告了新的最先进结果,例如,在仅使用5%的标注图像时,我们在AFLW数据集上的表现超过了以往的所有最先进方法。