9일 전

OmniPose: 다중 인원 포즈 추정을 위한 다중 스케일 프레임워크

Bruno Artacho, Andreas Savakis
OmniPose: 다중 인원 포즈 추정을 위한 다중 스케일 프레임워크
초록

우리는 다중 인원 포즈 추정에서 최고 성능을 달성하는 단일 통과(end-to-end 훈련 가능한) 프레임워크인 OmniPose를 제안한다. 새로운 워터폴 모듈(waterfall module)을 활용한 OmniPose 아키텍처는 후처리 과정 없이도 백본 특징 추출기의 효과를 향상시키는 다중 해상도 특징 표현을 효과적으로 활용한다. OmniPose는 다중 해상도 특징 추출기에서 가우시안 히트맵 조절을 통해 스케일 간 맥락 정보를 통합하고, 관절 위치를 정밀하게 추정함으로써 최신 기술 수준의 정확도를 달성한다. OmniPose에서 개선된 워터폴 모듈을 통해 얻어진 다중 해상도 표현은 계단식 아키텍처에서의 점진적 필터링의 효율성을 살리면서도 공간 피라미드 구성과 유사한 다중 해상도 시야(field-of-view)를 유지한다. 다양한 데이터셋에 대한 실험 결과는, 개선된 HRNet 백본과 워터폴 모듈을 갖춘 OmniPose가 다중 인원 포즈 추정에 있어 강력하고 효율적인 아키텍처임을 입증하며, 최고 성능을 실현함을 보여준다.