2달 전
RTMPose: MMPose를 기반으로 한 실시간 다중 인물 포즈 추정
Jiang, Tao ; Lu, Peng ; Zhang, Li ; Ma, Ningsheng ; Han, Rui ; Lyu, Chengqi ; Li, Yining ; Chen, Kai

초록
최근 2D 포즈 추정에 대한 연구들은 공개 벤치마크에서 뛰어난 성능을 달성하였으나, 산업계에서는 여전히 무거운 모델 파라미터와 높은 지연 시간으로 인해 어려움을 겪고 있습니다. 이러한 간극을 메우기 위해, 우리는 포즈 추정의 핵심 요소인 패러다임, 모델 아키텍처, 훈련 전략 및 배포를 경험적으로 탐구하고, MMPose 기반의 고성능 실시간 다중 인물 포즈 추정 프레임워크인 RTMPose를 제시합니다. 우리의 RTMPose-m은 Intel i7-11700 CPU에서 90FPS 이상, NVIDIA GTX 1660 Ti GPU에서 430FPS 이상으로 COCO 데이터셋에서 75.8% AP를 달성하였으며, RTMPose-l은 COCO-WholeBody 데이터셋에서 67.0% AP를 달성하며 130FPS 이상의 성능을 보여주었습니다. 또한 RTMPose가 중요한 실시간 응용 분야에서 얼마나 효과적인지 평가하기 위해 모바일 장치에 배포한 후의 성능도 보고합니다. 우리의 RTMPose-s는 Snapdragon 865 칩에서 70FPS 이상으로 COCO 데이터셋에서 72.2% AP를 달성하여 기존 오픈 소스 라이브러리를 능가하였습니다. 코드와 모델은 https://github.com/open-mmlab/mmpose/tree/1.x/projects/rtmpose 에서 제공됩니다.