17일 전

키포인트 표현의 재고: 다중 인물 인간 자세 추정을 위한 키포인트와 자세를 객체로 모델링하기

William McNally, Kanav Vats, Alexander Wong, John McPhee
키포인트 표현의 재고: 다중 인물 인간 자세 추정을 위한 키포인트와 자세를 객체로 모델링하기
초록

키 포인트 추정 작업, 예를 들어 인간 자세 추정에서는 히트맵 기반 회귀가 주류 방법이지만, 이 방법은 명백한 단점이 존재한다. 즉, 히트맵은 본질적으로 양자화 오차를 겪으며, 생성 및 후처리 과정에서 과도한 계산을 요구한다. 보다 효율적인 해결책을 찾고자 하는 동기로, 우리는 개별 키 포인트와 공간적으로 관련된 키 포인트 집합(즉, 자세)을 밀집형 단계별 앵커 기반 탐지 프레임워크 내의 객체로 모델링하는 방법을 제안한다. 따라서 본 방법을 'KAPAO(Kinematic Keypoints And Poses As Objects)'라고 명명하며, 발음은 '카-파우'이다. KAPAO는 단일 단계 다중 인원 인간 자세 추정 문제에 적용되며, 인간 자세와 키 포인트 객체를 동시에 탐지하고, 탐지 결과를 융합함으로써 두 객체 표현 방식의 장점을 극대화한다. 실험 결과, KAPAO는 히트맵 후처리에 큰 부담을 느끼는 기존 방법보다 더 빠르고 정확한 성능을 보였다. 특히 테스트 시 증강 기법을 사용하지 않는 실제 환경에서는 정확도와 속도의 트레이드오프가 더욱 유리하다. 소스 코드: https://github.com/wmcnally/kapao

키포인트 표현의 재고: 다중 인물 인간 자세 추정을 위한 키포인트와 자세를 객체로 모델링하기 | 최신 연구 논문 | HyperAI초신경