
초록
본 연구에서는 비제약 환경의 동영상에서 미지의 수의 사람들의 자세 추정과 추적이라는 어려운 문제를 소개합니다. 이미지에서 다중 인물 자세 추정을 위한 기존 방법들은 이 문제에 직접적으로 적용할 수 없습니다. 왜냐하면 각 인물의 자세 추정뿐만 아니라 시간에 따른 인물 연관성 문제도 해결해야 하기 때문입니다. 따라서 우리는 단일 공식화로 다중 인물 자세 추정과 추적을 공동으로 모델링하는 새로운 방법을 제안합니다. 이를 위해 동영상에서 신체 관절 검출 결과를 시공간 그래프로 표현하고, 정수 선형 계획법(integer linear program)을 사용하여 그래프를 각 인물에 해당하는 가능한 신체 자세 궤적(sub-graphs that correspond to plausible body pose trajectories)으로 분할합니다. 제안된 접근 방식은 암묵적으로 사람들의 가림(occlusion)과 절단(truncation)을 처리합니다. 이 문제는 문헌에서 양적으로 다루어지지 않았기 때문에, 우리는 도전적인 "다중 인물 포즈트랙(Multi-Person PoseTrack)" 데이터셋을 소개하며, 또한 규모, 크기, 위치 또는 사람 수에 대한 어떤 가정도 하지 않는 완전히 비제약적인 평가 프로토콜을 제안합니다. 마지막으로, 우리는 제안된 접근 방식과 여러 베이스라인 방법들을 새롭게 만든 데이터셋에서 평가하였습니다.