
摘要
我们提出了一种基于教师-学生学习框架的新方法,用于在没有任何3D注释或辅助信息的情况下进行3D人体姿态估计。为了解决这一无监督学习问题,教师网络采用了基于姿态字典的建模方法来进行正则化,以估计出物理上合理的3D姿态。为了处理教师网络中的分解模糊性,我们提出了一种循环一致性架构,通过促进3D旋转不变性来训练教师网络。为了进一步提高估计精度,学生网络采用了一种新颖的图卷积网络(Graph Convolution Network),以增强灵活性直接估计3D坐标。此外,我们还采用了另一种循环一致性架构,通过促进3D旋转等变性来利用几何一致性,并结合从教师网络中提取的知识蒸馏(Knowledge Distillation)技术,以提升姿态估计性能。我们在Human3.6M和MPI-INF-3DHP数据集上进行了广泛的实验。与现有的最先进的无监督方法相比,我们的方法将3D关节预测误差降低了11.4%,并且在Human3.6M数据集上也优于许多使用辅助信息的弱监督方法。代码将在https://github.com/sjtuxcx/ITES提供。