17일 전

InsPose: 단일 단계 다인원 자세 추정을 위한 인스턴스 인지 네트워크

Dahu Shi, Xing Wei, Xiaodong Yu, Wenming Tan, Ye Ren, Shiliang Pu
InsPose: 단일 단계 다인원 자세 추정을 위한 인스턴스 인지 네트워크
초록

다중 인원 자세 추정은 매력적이면서도 도전적인 과제이다. 기존의 방법들은 대부분 두 단계 프레임워크, 즉 상향식(top-down) 및 하향식(bottom-up) 방법에 기반하고 있다. 두 단계 방법은 추가적인 사람 검출기로 인한 높은 계산적 중복을 겪거나, 모든 인스턴스 무관 키포인트를 예측한 후 키포인트를 휴리스틱하게 그룹화해야 하는 문제가 있다. 단일 단계 파라다임은 다중 인원 자세 추정 파이프라인을 단순화하려는 시도로 주목을 받고 있다. 그러나 최근의 단일 단계 방법은 단일 특징 벡터에서 다양한 전신 자세를 회귀하는 데 어려움이 있어 성능이 낮다는 한계를 지닌다. 기존의 복잡한 휴리스틱 설계와는 달리, 우리는 인스턴스 인지(dynamic) 동적 네트워크를 활용하여 간단하면서도 효과적인 솔루션을 제안한다. 구체적으로 각 인스턴스에 대해 네트워크 파라미터의 일부를 적응적으로 조정할 수 있는 인스턴스 인지 모듈을 제안한다. 본 솔루션은 다양한 자세를 인식하는 데 있어 네트워크의 표현 능력과 적응 능력을 크게 향상시키면서도, 컴팩트한 엔드투엔드 학습 가능한 파이프라인을 유지한다. MS-COCO 데이터셋에서 실시한 광범위한 실험 결과, 제안한 방법은 기존의 단일 단계 방법보다 뚜렷한 성능 향상을 보였으며, 최신 두 단계 접근법과 비교해 정확성과 효율성 사이의 더 나은 균형을 달성했다. 코드와 모델은 \url{https://github.com/hikvision-research/opera}에서 제공된다.