2달 전

인체 자세 추정을 위한 합성곱 파트 히트맵 회귀

Adrian Bulat; Georgios Tzimiropoulos
인체 자세 추정을 위한 합성곱 파트 히트맵 회귀
초록

본 논문은 합성곱 신경망(CNN)을 사용한 인간 자세 추정에 관한 것입니다. 본 연구의 주요 기여는 부위 관계와 공간적 맥락을 학습하도록 특별히 설계된 CNN 캐스케이드 구조로, 심각한 부위 가림 현상이 있는 경우에도 견고하게 자세를 추론할 수 있습니다. 이를 위해 우리는 검출 후 회귀 CNN 캐스케이드를 제안합니다. 캐스케이드의 첫 번째 단계는 부위 검출 히트맵을 출력하고, 두 번째 단계는 이 히트맵에서 회귀를 수행합니다. 제안된 구조의 장점은 여러 가지입니다: 네트워크가 이미지에서 어디에 집중해야 하는지를 안내하며, 효과적으로 부위 제약 조건과 맥락을 인코딩합니다. 더욱 중요한 것은, 가려진 부위의 검출 히트맵이 낮은 신뢰도 점수를 제공하여, 이로 인해 우리 네트워크의 회귀 부분이 이러한 부위의 위치를 예측하기 위해 맥락 정보에 의존하도록 유도할 수 있다는 점입니다. 또한, 제안된 캐스케이드가 다양한 CNN 구조를 쉽게 통합할 수 있을 정도로 유연하다는 것을 보여줍니다. 이에는 최근 잔차 학습 기반의 구조도 포함됩니다. 마지막으로, MPII 및 LSP 데이터 세트에서 우리의 캐스케이드가 최상의 성능을 달성함을 입증하였습니다. 코드는 http://www.cs.nott.ac.uk/~psxab5/ 에서 다운로드할 수 있습니다.