CoMotion:并发多人3D运动
Alejandro Newell, Peiyun Hu, Lahav Lipson, Stephan R. Richter, Vladlen Koltun
发布日期: 4/23/2025

摘要
我们介绍了一种从单一单目摄像头流中检测和追踪多人详细三维姿态的方法。我们的系统在充满复杂姿态和遮挡的拥挤场景中保持了时间上连贯的预测。我们的模型同时执行强大的逐帧检测和学习到的姿态更新,以实现帧与帧之间的人员追踪。与跨时间匹配检测不同,我们的方法直接从新的输入图像更新姿态,这使得在遮挡情况下进行在线追踪成为可能。我们在多个图像和视频数据集上进行训练,并利用伪标签注释生成一个模型,该模型在三维姿态估计的准确性方面达到了当前最先进的系统水平,同时在长时间内追踪多个人员时速度更快、更准确。代码和权重可在 https://github.com/apple/ml-comotion 获取。