11일 전

3D 그림 구조 재검토: 다중 인간 자세 추정

{Slobodan Ilic, Mykhaylo Andriluka, Vasileios Belagiannis, Nassir Navab, Sikandar Amin, Bernt Schiele}
초록

다수의 카메라 시점에서 다수의 인간에 대한 3차원 자세 추정 문제를 다룹니다. 단일 인간에서 다수의 인간 자세 추정으로, 그리고 2차원 공간에서 3차원 공간으로의 전이 과정은 상태 공간이 훨씬 커지며, 특히 인간의 정체성을 미리 알지 못할 경우 겹침(occlusion)과 시점 간 모호성(ambiguity)이 발생하므로 도전적인 과제입니다. 이러한 문제를 해결하기 위해, 각 카메라 시점에서 부분 검출기(part detector)를 통해 얻은 신체 부위의 대응 쌍을 삼각측량(triangulation)을 통해 상태 공간을 축소합니다. 삼각측량 후 다수의 인간에 대해 잘못된 또는 혼합된 신체 부위의 모호성과 오류 검출(false positive detection)로 인한 문제를 해결하기 위해, 3차원 그림 구조(3D pictorial structures, 3DPS) 모델을 제안합니다. 본 모델은 다시보기(unary) 잠재력(multi-view unary potentials)에 기반하며, 사전 모델(prior model)을 쌍체(pairwise) 및 삼체(ternary) 잠재력 함수에 통합합니다. 잠재력의 영향력을 균형 있게 조절하기 위해, 구조적 서포트 벡터 머신(Structured SVM, SSVM)을 사용하여 모델 파라미터를 학습합니다. 제안한 모델은 단일 및 다수의 인간 자세 추정 모두에 적용 가능한 일반적인 구조를 지닙니다. 제안 모델의 성능을 단일 및 다수의 인간 자세 추정에 대해 평가하기 위해 네 가지 서로 다른 데이터셋을 활용합니다. 먼저 잠재력의 기여도를 분석한 후, 관련 기존 연구들과의 비교를 통해 본 모델이 우수한 성능을 보임을 입증합니다.

3D 그림 구조 재검토: 다중 인간 자세 추정 | 최신 연구 논문 | HyperAI초신경