4달 전

인체 포즈 추정에 공간적 맥락 정보 활용

Hong Zhang; Hao Ouyang; Shu Liu; Xiaojuan Qi; Xiaoyong Shen; Ruigang Yang; Jiaya Jia
인체 포즈 추정에 공간적 맥락 정보 활용
초록

우리는 인간 자세 추정에서 공간적 맥락 정보의 중요성을 탐구합니다. 대부분의 최신 자세 네트워크는 다단계 방식으로 훈련되며, 깊은 감독을 위해 여러 보조 예측을 생성합니다. 이 원칙에 따라, 우리는 개념적으로 간단하면서도 계산적으로 효율적인 두 가지 모듈, 즉 캐스케이드 예측 융합(Cascade Prediction Fusion, CPF)과 포즈 그래프 신경망(Pose Graph Neural Network, PGNN)을 제시하여 잠재적인 맥락 정보를 활용합니다. 캐스케이드 예측 융합은 이전 단계에서 얻은 예측 맵들을 축적하여 유용한 신호를 추출합니다. 이렇게 생성된 맵들은 후속 단계의 예측을 안내하는 사전 정보로도 작동합니다. 관절 간의 공간적 상관관계를 강화하기 위해, 우리의 PGNN은 그래프 형태로 인간 자세의 구조적 표현을 학습합니다.这样一来,不同关节之间的直接消息传递得以实现,空间关系得以捕捉(다른 관절 간의 직접 메시지 전달이 가능해지고 공간 관계가 포착됩니다). 이 두 개의 모듈은 매우 제한적인 계산 복잡도만 필요로 합니다. 실험 결과는 우리 방법이 MPII와 LSP 벤치마크에서 기존 방법보다 일관성 있게 우수함을 입증하였습니다.注:在最后一句中,“MPII” 和 “LSP” 是机构名称或数据集名称,通常会保留原文。