2 个月前

通过分解的空间嵌入实现对象地标的无监督学习

James Thewlis; Hakan Bilen; Andrea Vedaldi
通过分解的空间嵌入实现对象地标的无监督学习
摘要

自动学习物体类别结构仍然是计算机视觉领域的一个重要开放问题。在本文中,我们提出了一种新颖的无监督方法,能够发现并学习物体类别的关键点,从而表征其结构。我们的方法基于分解由视角变化或物体变形引起的图像形变,通过训练一个深度神经网络来检测与这些视觉效果一致的关键点。此外,我们展示了所学的关键点能够在不同物体实例之间建立有意义的对应关系,而无需显式地施加这一要求。我们在多种类型的物体上对这种方法进行了定性评估,包括自然物体和人造物体。我们还证明了我们的无监督关键点在人脸基准数据集中能够高度预测手动标注的关键点,并且可以以高精度回归这些关键点。