
摘要
外观线索(appearance cue)和约束线索(constraint cue)在人体姿态估计中均至关重要。然而,现有大多数方法倾向于过度依赖前者而忽视后者。为此,本文提出一种名为“信息丢弃增强”(Augmentation by Information Dropping, AID)的新方法,以验证并解决这一困境。在AID作为前提条件的基础上,我们进一步设计了定制化的训练策略,该策略通过分析训练过程中损失与性能的变化模式,从信息供给的角度出发,优化训练过程。实验结果表明,作为一种与模型无关的方法,AID在不同输入尺寸、网络架构、主干网络(backbone)、训练与测试集下,均能有效提升多种前沿人体姿态估计方法的性能,涵盖自底向上(bottom-up)与自顶向下(top-down)两种范式。在广泛使用的COCO人体姿态估计测试集上,AID在自顶向下范式中稳定提升约0.6 AP,在自底向上范式中提升最高达1.5 AP;在更具挑战性的CrowdPose数据集上,性能提升超过1.5 AP。由于AID显著突破了人体姿态估计任务的性能边界,并取得了新的最先进(state-of-the-art)水平,我们期望AID能成为训练人体姿态估计器的标准配置。相关源代码将公开发布,以促进后续研究。