17 天前
HandAugment:一种用于基于深度信息的3D手部姿态估计的简单数据增强方法
Zhaohui Zhang, Shipeng Xie, Mingxiu Chen, Haichao Zhu

摘要
基于三维深度图像的手部姿态估计在计算机视觉领域已得到广泛研究,采用了多种技术手段。尽管近年来基于深度学习的方法显著提升了性能,但由于缺乏大规模数据集(如ImageNet)或高效的数据合成方法,该问题仍未完全解决。本文提出了一种名为HandAugment的方法,用于合成图像数据以增强神经网络的训练过程。该方法包含两个主要部分:首先,我们设计了一种两阶段神经网络架构,使网络能够聚焦于手部区域,从而提升整体性能;其次,我们提出了一种简单而有效的方法,通过在图像空间中融合真实图像与合成图像来实现数据增强。实验结果表明,本方法在HANDS 2019挑战赛中基于深度图像的三维手部姿态估计任务中取得了第一名的成绩。