2달 전

대립적 포즈넷: 인간 포즈 추정을 위한 구조 인식 합성곱 신경망

Yu Chen; Chunhua Shen; Xiu-Shen Wei; Lingqiao Liu; Jian Yang
대립적 포즈넷: 인간 포즈 추정을 위한 구조 인식 합성곱 신경망
초록

단일 카메라 이미지에서 인간 자세 추정을 수행할 때, 관절 가림 현상과 사람 몸체 간의 겹침이 종종 자세 예측의 편차를 초래합니다. 이러한 상황에서는 생물학적으로 불가능한 자세 예측이 발생할 수 있습니다. 반면에, 인간의 시각은 관절 간 연결성의 기하학적 제약 조건을 활용하여 자세를 예측할 수 있습니다. 이 문제를 해결하기 위해 인간 몸체 구조에 대한 사전 정보를 통합하는 방안으로, 우리는 새로운 구조 인식 합성곱 신경망을 제안합니다. 이 신경망은 딥러닝 네트워크의 훈련 과정에서 이러한 사전 정보를 암시적으로 고려하도록 설계되었습니다. 이러한 제약 조건을 명시적으로 학습하는 것은 일반적으로 어려운 작업입니다. 대신, 우리는 진짜 자세와 가짜 자세(예: 생물학적으로 불가능한 자세)를 구분하기 위한 판별자를 설계하였습니다. 만약 자세 생성기(G)가 판별자가 진짜와 구분하지 못하게 만드는 결과를 생성한다면, 네트워크는 성공적으로 이러한 사전 정보를 학습하게 됩니다.