2 个月前

面向对象而非图像:一种统一的姿态对齐表示方法用于细粒度识别

Pei Guo; Ryan Farrell
面向对象而非图像:一种统一的姿态对齐表示方法用于细粒度识别
摘要

由于姿态变化导致的显著外观差异构成了细粒度识别中的巨大挑战,而最近使用注意力机制或二阶统计的方法未能充分应对这一问题。现代卷积神经网络(CNNs)通常缺乏对物体姿态的显式理解,反而会被纠缠在一起的姿态和外观所困扰。在本文中,我们提出了一种基于层次化姿态对齐区域构建的统一物体表示方法。与传统的以图像轴对齐的区域表示不同,该方法通过姿态对齐的补丁来描述相对于物体姿态的外观特征,这些特征对于姿态、尺度和旋转的变化具有鲁棒性。我们提出了一种算法,该算法执行姿态估计并形成由层次化姿态对齐区域特征拼接而成的统一物体表示,然后将其输入分类网络。实验结果表明,该算法在广泛使用的CUB-200数据集上比现有方法提高了近2%,在规模更大的NABirds数据集上则提高了超过8%。与竞争方法相比,该范式的有效性表明了在细粒度识别领域持续进步中解耦姿态和外观的关键重要性。

面向对象而非图像:一种统一的姿态对齐表示方法用于细粒度识别 | 最新论文 | HyperAI超神经