한 달 전

순서 깊이 지도를 이용한 3D 인간 자세 추정

Georgios Pavlakos; Xiaowei Zhou; Kostas Daniilidis
순서 깊이 지도를 이용한 3D 인간 자세 추정
초록

단일 이미지에서 3차원 인간 자세 추정을 위한 엔드투엔드 시스템의 훈련 능력은 현재 자연 이미지를 위한 3차원 주석의 제한된 사용 가능성이 제약 요인으로 작용하고 있습니다. 대부분의 데이터셋은 스튜디오 환경에서 모션 캡처(MoCap) 시스템을 사용하여 캡처되며, MPII나 LSP와 같은 2차원 인간 자세 데이터셋의 다양성을 달성하기가 어렵습니다. 정확한 3차원 기준 진실에 대한 필요성을 완화하기 위해, 우리는 인간 관절의 서열 깊이를 제공하는 더 약한 감독 신호를 사용하는 것을 제안합니다. 이 정보는 다양한 이미지와 자세에 대해 인간 주석자로부터 얻을 수 있습니다. 우리는 이러한 서열 관계로 훈련된 컨볼루셔널 네트워크(ConvNets)의 효과성과 유연성을 다른 설정에서 보여주며, 항상 정확한 3차원 관절 좌표로 훈련된 ConvNets와 경쟁력을 갖춘 성능을 달성합니다. 또한, 접근 방식의 잠재력을 입증하기 위해, 인기 있는 LSP와 MPII 데이터셋에 서열 깊이 주석을 추가하였습니다. 이 확장은 비-스튜디오 조건에서 정량적 및 정성적 평가를 제시할 수 있게 합니다. 동시에, 이러한 서열 주석은 일반적인 ConvNets의 3차원 인간 자세 훈련 절차에 쉽게 통합될 수 있으며, 이를 통해 관련 벤치마크에서 새로운 최고 성능을 달성하고 서열 깊이 감독이 3차원 인간 자세 추정에 효과적임을 검증하였습니다.