2달 전

다중 인원 3D 운동 예측을 위한 다중 범위 트랜스포머

Wang, Jiashun ; Xu, Huazhe ; Narasimhan, Medhini ; Wang, Xiaolong
다중 인원 3D 운동 예측을 위한 다중 범위 트랜스포머
초록

우리는 다중 인원의 3D 운동 궤도 예측을 위한 새로운 프레임워크를 제안합니다. 우리의 주요 관찰 결과는 한 사람의 행동과 행동이 주변에 있는 다른 사람들에게 크게 의존할 수 있다는 것입니다. 따라서 각각의 인간 자세 궤도를 독립적으로 예측하는 대신, 개인적인 움직임을 위한 지역 범위 인코더와 사회적 상호작용을 위한 전역 범위 인코더를 포함하는 멀티-레인지 트랜스포머(Multi-Range Transformers) 모델을 소개합니다. 트랜스포머 디코더는 해당 자세를 쿼리로 사용하여 지역 범위와 전역 범위 인코더 특성을 모두 참조하면서 각 사람에 대한 예측을 수행합니다. 우리의 모델은 단기 3D 운동 예측에서 최신 방법론들을 능가할 뿐만 아니라 다양한 사회적 상호작용을 생성합니다. 더욱 흥미롭게도, 우리의 모델은 사람들을 자동으로 여러 상호작용 그룹으로 나누어 15명의 운동을 동시에 예측할 수 있습니다. 프로젝트 페이지와 코드는 https://jiashunwang.github.io/MRT/ 에서 확인 가능합니다.

다중 인원 3D 운동 예측을 위한 다중 범위 트랜스포머 | 최신 연구 논문 | HyperAI초신경