
과거 자세 시퀀스가 주어졌을 때 다양한 인간 운동을 예측하는 것이 점점 더 많은 관심을 받고 있습니다. 그러나 빠른 발전에도 불구하고, 기존 연구는 주로 확률 기반 샘플링을 통해 인간 운동의 다중 모드 특성을 포착하는데, 이 과정에서 모드 붕괴(mode collapse) 현상이 널리 관찰되었습니다. 본 논문에서는 무작위로 샘플링된 코드를 결정론적인 학습 가능한 구성요소인 앵커(anchors)와 분리하여 샘플의 정밀도와 다양성을 향상시키는 간단하면서도 효과적인 접근법을 제안합니다. 앵커는 공간 앵커(spatial anchors)와 시간 앵커(temporal anchors)로 더 나아가 분해되며, 이는 공간-시간 차이에 대한 유연하게 해석 가능한 제어를 제공합니다. 원칙적으로, 우리의 공간-시간 앵커 기반 샘플링(STARS) 방법은 다양한 운동 예측기에게 적용될 수 있습니다. 여기서 우리는 인간 운동에 대한 사전 지식(예: 공간 국소성)을 인코딩하는 상호 작용 강화형 공간-시간 그래프 컨볼루셔널 네트워크(IE-STGCN)를 제안하며, 이에 앵커를 통합합니다. 광범위한 실험 결과는 우리의 접근법이 확률적 예측과 결정론적 예측 모두에서 최신 연구보다 우수함을 입증하며, 이를 인간 운동 모델링의 통합 프레임워크로 제시하고 있습니다. 우리의 코드와事前训练模型可以在 https://github.com/Sirui-Xu/STARS 获取.注:最后一句中的“事前训练模型”应该是“预训练模型”的误用,正确的翻译应为:우리의 코드와 사전 학습된 모델은 https://github.com/Sirui-Xu/STARS 에서 이용할 수 있습니다.