
摘要
近年来,基于参数化姿态与形状表示的三维人体重建(3D Human Body Reconstruction,简称3DHR)领域取得了显著进展。然而,将3DHR技术应用于真实世界中复杂多样的场景(即“野生数据”in-the-wild数据)仍面临诸多挑战。其主要瓶颈在于:由于多种因素的影响,获取真实野生场景下准确的三维人体姿态真值(Ground Truth, GT)仍极为困难。近期,针对3DHR的测试时优化(test-time refinement)方法尝试利用预先获取的2D现成人体关键点信息,以弥补野生数据中缺乏三维监督信号的问题。然而,我们观察到,仅依赖额外的2D监督信号,容易导致常见3DHR骨干网络出现过拟合现象,从而使测试时优化任务变得难以有效实施。为应对这一挑战,本文提出一种协同式策略,以增强3DHR测试时优化工作的有效性。具体而言,我们首先引入一种预适应(pre-adaptation)机制,该机制在统一框架内协同多个3DHR模型,直接优化其初始输出结果。随后,在特定设置下,将该预适应策略与测试时适应(test-time adaptation)方法相结合,有效缓解过拟合问题,进一步提升3DHR性能。整个框架被命名为3DHR-Co。实验结果表明,所提出的方法可显著提升常见经典3DHR骨干网络的性能,最大实现约34毫米的姿势误差降低,在野生场景基准数据集上达到顶尖水平。这一成果充分说明,我们的方法有效释放了经典3DHR骨干网络的潜在能力。基于上述发现,我们进一步对所提框架的多种配置进行了系统性探究,以更全面地揭示协同机制在3DHR任务中的优势与潜力。