
초록
본 연구에서는 단일 카메라 비디오에서 인간의 동작 정보를 활용하여 자세 추정을 개선하는 방법을 제안합니다. 이를 위해 활동에 대한 고차원적인 정보를 활용하여 동작 특이적 외관 모델과 자세 사전 확률을 모델링함으로써 고차 부품 의존성을 통합하는 그림 구조 모델을 제시합니다. 그러나 추가적인 비용이 많이 드는 동작 인식 프레임워크를 사용하지 않고, 우리의 자세 추정 프레임워크를 통해 효율적으로 동작 사전 확률을 추정합니다. 이는 균일한 동작 사전 확률로 시작하여 자세 추정 과정에서 동작 사전 확률을 업데이트함으로써 달성됩니다. 또한, 동작 클래스 간에 적절한 외관 공유량을 학습하면 자세 추정이 개선됨을 보입니다. 우리는 제안된 방법의 효과성을 80,000장 이상의 테스트 이미지를 포함하는 두 개의 도전적인 자세 추정 및 동작 인식 데이터셋에서 입증하였습니다.