2달 전
대립적 포즈넷: 인간 포즈 추정을 위한 구조 인식 합성곱 신경망
Yu Chen; Chunhua Shen; Xiu-Shen Wei; Lingqiao Liu; Jian Yang

초록
단일 카메라 이미지에서 인간 자세 추정을 수행할 때, 관절 가림 현상과 사람 몸체 간의 겹침이 종종 자세 예측의 편차를 초래합니다. 이러한 상황에서는 생물학적으로 불가능한 자세 예측이 발생할 수 있습니다. 반면에, 인간의 시각은 관절 간 연결성의 기하학적 제약 조건을 활용하여 자세를 예측할 수 있습니다. 이 문제를 해결하기 위해 인간 몸체 구조에 대한 사전 정보를 통합하는 방안으로, 우리는 새로운 구조 인식 합성곱 신경망을 제안합니다. 이 신경망은 딥러닝 네트워크의 훈련 과정에서 이러한 사전 정보를 암시적으로 고려하도록 설계되었습니다. 이러한 제약 조건을 명시적으로 학습하는 것은 일반적으로 어려운 작업입니다. 대신, 우리는 진짜 자세와 가짜 자세(예: 생물학적으로 불가능한 자세)를 구분하기 위한 판별자를 설계하였습니다. 만약 자세 생성기(G)가 판별자가 진짜와 구분하지 못하게 만드는 결과를 생성한다면, 네트워크는 성공적으로 이러한 사전 정보를 학습하게 됩니다.